Des chercheurs du MIT démontrent la technique d’exploration des connaissances des grands modèles de langage
- Ils ont découvert que les grands modèles de langage utilisent un mécanisme simple pour retrouver les connaissances stockées lorsqu’ils répondent aux prompts des utilisateurs.
- Les chercheurs montrent qu’en exploitant ce mécanisme simple, il est possible d’identifier ce que le modèle sait sur divers sujets et de corriger des informations mal stockées.
La complexité des grands modèles de langage
- Les grands modèles de langage sont utilisés dans de nombreux domaines, comme le support client, la génération de code et la traduction automatique, mais leur mode de fonctionnement n’est pas encore entièrement compris.
- Des chercheurs du MIT et d’autres institutions ont étudié le mécanisme par lequel ces énormes modèles de machine learning retrouvent les connaissances qu’ils ont stockées.
Un mécanisme simple de récupération des connaissances
- Les résultats montrent que les grands modèles de langage utilisent souvent une simple fonction linéaire pour récupérer et décoder les faits stockés.
- Le modèle utilise la même fonction de décodage pour des faits de type similaire.
- Une fonction linéaire est une équation qui représente une relation en ligne droite entre deux variables.
Explorer ce que le modèle sait
- En identifiant les fonctions linéaires associées à différents faits, les chercheurs explorent ce que le modèle sait sur de nouveaux sujets et vérifient où ces connaissances sont stockées dans le modèle.
- Grâce à la technique développée et aux fonctions simples ainsi estimées, ils ont constaté que même lorsque le modèle donne une mauvaise réponse, il stocke souvent malgré tout la bonne information.
Visualiser les connaissances du modèle
- Les chercheurs utilisent ces fonctions pour déterminer ce que le modèle considère réellement comme vrai sur différents sujets.
- Par exemple, en partant du prompt "Bill Bradley was a" et en utilisant les fonctions de décodage pour "plays sports" et "attended university", ils vérifient si le modèle sait que M. Bradley était basketteur et diplômé de Princeton University.
- À l’aide de cette technique d’exploration, ils ont créé une grille appelée « lentille d’attributs » afin de visualiser où l’information sur une relation donnée est stockée dans les différentes couches du transformer.
L’avis de GN⁺
- Cette étude fait progresser d’un cran la compréhension de la manière dont les grands modèles de langage stockent et retrouvent les connaissances factuelles.
- Elle laisse entrevoir la possibilité d’exploiter ces résultats pour corriger les connaissances et éviter les erreurs des chatbots IA, afin de réduire leur tendance à fournir de mauvaises informations.
- Si cette technique est appliquée, elle pourrait contribuer à améliorer la fiabilité de l’IA et aider à offrir une meilleure expérience utilisateur.
- Cependant, comme tous les faits ne sont pas encodés de manière linéaire, des recherches supplémentaires sont nécessaires pour savoir si cette technique peut s’appliquer à tous les types de récupération de connaissances.
- Parmi les projets open source offrant des capacités similaires figurent BERT de Google et la série GPT d’OpenAI, qui contribuent eux aussi à mieux comprendre le fonctionnement des grands modèles de langage.
- Lors de l’introduction de nouvelles techniques, il faut tenir compte de l’équilibre entre la complexité du modèle et son interprétabilité, et l’un des bénéfices attendus ici serait une amélioration de la précision et de la fiabilité du modèle.
1 commentaires
Commentaire Hacker News
Ce travail remarquable met en lumière certains des plus gros problèmes actuels de l'IA
La structure du langage rend Word2Vec possible
Aide à comprendre ce que signifie le fait que les faits soient stockés sous forme de fonction linéaire
Curiosité sur les types de fonctions utilisés pour encoder les connaissances en programmation
Ressemble à ce que font les vecteurs de relation dans Word2Vec
Les LLM semblent être un bon mécanisme de compression
Cela rappelle l'exemple d'embedding « King - Man + Woman = Queen »
Il est difficile de comprendre comment un « fichier CSV / une base de données / un modèle » avec 7 milliards de « paramètres » peut fournir un LLM/GPT interactif et bien informé sur presque tous les sujets
J'aime beaucoup cet article et le fait qu'il ait mené des expériences pour valider ces idées
Possibilité de séparer la partie raisonnement de la partie information