LIMA - des performances proches de GPT-4 avec un modèle LLaMA 65B et seulement 1 000 prompts

xguru · 2023-05-23T09:36:28+09:00

"Less Is More for Alignment" Modèle LLaMA affiné avec seulement 1 000 prompts soigneusement sélectionnés, sans apprentissage par renforcement ni modélisation des préférences Jugé équivalent ou préféré à GPT-4 dans 43 % des cas ; 58 % face à Bard ; 65 % de mieux que DaVinci003 entraîné avec du feedback humain L’hypothèse du papier est que la quasi-totalité des connaissances d’un LLM est apprise pendant le prétraining, et que l’alignement est un processus simple consistant à apprendre le format/style d’interaction avec les utilisateurs Nouveau papier de Meta AI

(arxiv.org)

24 points par xguru 2023-05-23 | 4 commentaires | Partager sur WhatsApp

"Less Is More for Alignment"
Modèle LLaMA affiné avec seulement 1 000 prompts soigneusement sélectionnés, sans apprentissage par renforcement ni modélisation des préférences
Jugé équivalent ou préféré à GPT-4 dans 43 % des cas ; 58 % face à Bard ; 65 % de mieux que DaVinci003 entraîné avec du feedback humain
L’hypothèse du papier est que la quasi-totalité des connaissances d’un LLM est apprise pendant le prétraining, et que l’alignement est un processus simple consistant à apprendre le format/style d’interaction avec les utilisateurs
Nouveau papier de Meta AI

4 commentaires

merong 2023-05-23

Il aurait fallu poursuivre le projet Sejong et continuer à accumuler en open source des données pour des modèles de langue coréens. C’est vraiment un projet qu’on regrette...

kuroneko 2023-05-23

Les performances en anglais progressent si vite, mais c’est dommage que, à part GPT, la plupart des modèles ne maîtrisent pas bien le coréen...

dulco 2023-05-23

Le niveau d’apprentissage du coréen de Claude d’Anthropic est assez élevé, mais sa maîtrise reste encore différente sur certains points par rapport à ChatGPT.

test4458 2023-05-23

Bouhouhou, c’est vrai, en dehors de l’API GPT, tout le reste est vraiment au niveau des déchets pour le coréen...

LIMA - des performances proches de GPT-4 avec un modèle LLaMA 65B et seulement 1 000 prompts

À lire aussi

4 commentaires

LIMA - des performances proches de GPT-4 avec un modèle LLaMA 65B et seulement 1 000 prompts