- L’article traite d’un schéma d’apprentissage inhabituel observé lors du fine-tuning de grands modèles de langage (Large Language Models, LLMs), qui semblent apprendre efficacement à partir d’un seul exemple.
- Cette observation va à l’encontre de la compréhension habituelle de l’efficacité en nombre d’échantillons des réseaux neuronaux, selon laquelle plusieurs exemples sont généralement nécessaires pour apprendre efficacement.
- Pour vérifier ce phénomène, les auteurs ont mené une série d’expériences qui soutiennent l’hypothèse selon laquelle les LLMs peuvent mémoriser rapidement les entrées.
- Le processus d’apprentissage des réseaux neuronaux consiste à montrer des exemples d’entrée et de sortie, puis à les entraîner à prédire la sortie à partir de l’entrée. Ce processus est répété plusieurs fois (
epochs) afin que le modèle apprenne efficacement.
- En entraînant un modèle pour une compétition Kaggle, les auteurs ont observé à la fin de chaque
epoch une chute brutale de la perte, un comportement inhabituel qui a d’abord fait soupçonner un bug.
- Les auteurs, ainsi que d’autres développeurs de la communauté, ont constaté des schémas similaires en utilisant différentes boucles d’entraînement et méthodes, ce qui suggère qu’il ne s’agit pas d’un bug mais d’une caractéristique du fine-tuning des LLMs.
- L’hypothèse est que ces courbes d’entraînement montrent un surapprentissage, ce qui signifie que le modèle apprend à reconnaître l’entrée à partir d’un ou deux exemples seulement.
- Les auteurs ont mené des expériences avec différents plannings de taux d’apprentissage et ont observé que le modèle apprend rapidement à reconnaître un exemple après ne l’avoir vu qu’une seule fois.
- Ils suggèrent que les grands modèles de langage préentraînés peuvent présenter une surface de perte très lisse dans une région proche de la perte minimale, ce qui leur permet d’apprendre rapidement à partir d’un seul exemple.
- Cet apprentissage rapide pourrait remettre en cause les méthodes d’entraînement traditionnelles et aggraver le problème de l’oubli catastrophique, où le modèle oublie des informations précédemment apprises lorsque de nouvelles informations sont introduites.
- Les auteurs proposent comme pistes d’atténuation d’augmenter l’usage de techniques comme le dropout ou la profondeur stochastique, ou encore d’utiliser un mélange de jeux de données variés pendant l’entraînement.
- Ils appellent à poursuivre les recherches et à explorer des hypothèses alternatives afin de mieux comprendre ce phénomène et ses implications pour l’entraînement et l’usage des LLMs.
1 commentaires
Commentaire Hacker News