À quelle vitesse les grands modèles de langage apprennent-ils des compétences inattendues ?
- Une nouvelle étude sur les capacités des grands modèles de langage (Large Language Models, LLMs) suggère que les prétendues capacités « émergentes » se développent en réalité de manière progressive et prévisible.
- Les chercheurs ont décrit ces capacités comme un comportement « émergent », en les comparant à une transition de phase en physique, similaire au passage de l’eau liquide à la glace.
- Cependant, une équipe de l’université Stanford affirme que l’apparition soudaine de ces capacités n’est qu’une conséquence de la manière dont les chercheurs mesurent les performances des LLM.
Mesurer les performances des grands modèles de langage
- Les grands modèles de langage analysent d’immenses jeux de données textuels afin d’identifier les liens entre des mots qui apparaissent fréquemment ensemble.
- La taille d’un modèle se mesure par le nombre de paramètres, et plus il y en a, plus le LLM peut découvrir de connexions.
- GPT-2 disposait de 1,5 milliard de paramètres, GPT-3.5 de 350 milliards, et GPT-4 utilise 1,75 billion de paramètres.
Un développement progressif des capacités inattendues
- Les chercheurs de Stanford soutiennent que les capacités des LLM n’apparaissent pas soudainement et de façon imprévisible, mais qu’elles progressent de manière graduelle et prévisible.
- Par exemple, pour l’addition de nombres à trois chiffres, GPT-3 et LaMDA échouaient à effectuer des calculs exacts lorsqu’ils avaient moins de paramètres, mais devenaient soudain capables d’additionner à mesure que ce nombre augmentait.
- Au lieu d’évaluer les LLM uniquement sur la précision finale, les chercheurs ont utilisé une méthode de mesure accordant des points partiels, et ont constaté que les LLM apprenaient progressivement à prédire le bon ordre des chiffres.
Le point de vue d’autres scientifiques
- D’autres scientifiques soulignent que cette étude ne dissipe pas complètement la notion d’« émergence ».
- On ne sait toujours pas clairement quels critères de mesure utiliser, ni comment prédire à quel moment les performances des LLM vont s’améliorer brusquement.
- Certains chercheurs estiment que les précédents signalements de capacités « émergentes » étaient exacts et insistent sur le fait que, pour des compétences comme l’arithmétique, seule la bonne réponse compte.
L’avis de GN⁺
- Cette étude pourrait avoir des implications importantes pour le débat sur la sécurité de l’IA et ses risques potentiels. Si les capacités des LLM évoluent de manière prévisible, cela pourrait constituer un indicateur important pour le développement et la gestion sûrs de l’IA.
- Si ces résultats sont appliqués au développement réel de l’IA, les développeurs devront reconnaître l’importance des méthodes de mesure des performances et concevoir des approches d’évaluation plus sophistiquées.
- Cet article peut aider à comprendre les changements et avancées qui se produisent à la pointe de la recherche en IA, en particulier en apportant une nouvelle perspective sur la manière d’évaluer les performances des modèles d’IA.
- D’un point de vue critique, il faut reconnaître que ces résultats n’expliquent pas toutes les améliorations de performances des LLM et que, dans des modèles plus grands et plus complexes, des phénomènes d’« émergence » peuvent encore se produire.
- Dans ce domaine, la série GPT d’OpenAI est déjà largement utilisée sur le marché, et cette étude pourrait inspirer le développement d’autres LLMs similaires à GPT.
1 commentaires
Avis Hacker News
Quelques problèmes liés à l’étude
La difficulté de prévoir l’avenir
L’évolution des résultats quand on change les critères de mesure
Titre de l’article : "Are Emergent Abilities of Large Language Models a Mirage?"
Observations sur les changements brusques de capacité
L’approche par score partiel et l’entraînement des modèles
L’apparition progressive des capacités
Les limites des grands modèles de langage (Large Language Models, LLMs)
Confusion autour des critères de mesure