- Modèle Koala-13B entraîné, à l’instar d’Alpaca, sur des jeux de données de dialogue et d’instructions basés sur LLaMA
- Produit, pour diverses requêtes, des résultats préférés à ceux d’Alpaca et peut générer, dans au moins plus de la moitié des cas, des réponses identiques à celles de ChatGPT
- Supervised Fine-Tuning à partir de données de conversation open source collectées sur le Web
- 60K conversations de ShareGPT
- 87K exemples de questions-réponses de HC3
- Open Instruction Generalist (OIG)
- Jeu de données de 52K publié par Stanford Alpaca
- Anthropic HH (160K)
- OpenAI WebGPT (20K)
- OpenAI Summarization (93K)
2 commentaires
C’est littéralement un model zoo..
LLaMA, Alpaca, Koala... les modèles d'IA, c'est un vrai zoo.