-
Aperçu de la recherche
- Le modèle LIMO présente une découverte qui permet de mieux comprendre comment des capacités de raisonnement complexes émergent dans les grands modèles de langage.
- Contrairement aux idées reçues, un raisonnement mathématique complexe peut être induit efficacement avec un petit nombre d’exemples.
- LIMO atteint une précision de 57,1 % sur AIME et de 94,8 % sur MATH avec seulement 817 échantillons d’entraînement.
- Il s’agit d’une nette amélioration par rapport aux 6,5 % et 59,2 % des précédents modèles fondés sur le SFT, tout en n’utilisant que 1 % des données d’entraînement des approches antérieures.
-
Performances de LIMO
- LIMO affiche un gain absolu de performance de 40,5 % sur 10 benchmarks différents et surpasse des modèles entraînés avec 100 fois plus de données.
- Cela remet en cause l’idée existante selon laquelle le SFT conduit davantage à la généralisation qu’à la mémorisation.
-
Hypothèse LIMO
- L’hypothèse LIMO propose que si la connaissance du domaine est entièrement encodée dans le modèle de base lors du pré-entraînement, des capacités de raisonnement complexes peuvent émerger avec un minimum de démonstrations.
- Le seuil nécessaire pour induire un raisonnement complexe est déterminé par deux facteurs principaux :
- l’exhaustivité de la base de connaissances encodée dans le modèle pendant le pré-entraînement ;
- l’efficacité des exemples de post-entraînement en tant que « modèles cognitifs » montrant comment le modèle peut exploiter sa base de connaissances pour résoudre des tâches de raisonnement complexes.
-
Mise à disposition en open source
- LIMO est proposé sous la forme d’une suite open source complète afin de favoriser la reproductibilité et les recherches futures sur le raisonnement économe en données.
Aucun commentaire pour le moment.