Ajustement fin de Mistral 7B sur le draft de Magic: The Gathering
(generallyintelligent.substack.com)Résumé : exploration des techniques de fine-tuning de l’IA
- Effets et difficulté des techniques de fine-tuning
- Le fine-tuning complète les capacités de GPT-4 et promet de meilleurs résultats en vitesse et en coût.
- Pour combler le manque d’informations sur l’efficacité réelle et la difficulté du fine-tuning, une expérimentation directe a été menée.
Choix du problème
- Tester les capacités de raisonnement du modèle via le draft de Magic: The Gathering (MTG)
- MTG est un jeu de cartes stratégique, et le draft consiste à construire un deck en choisissant des cartes à partir d’un pool aléatoire.
- Le draft est une tâche complexe, bien adaptée car elle exige du raisonnement et une compréhension de nouvelles données.
- De vastes données historiques fournies par le service 17lands ont été utilisées, avec les choix de draft des meilleurs joueurs comme "ground truth".
Résultats et résumé
- Performances du modèle 7B fine-tuné
- Le modèle 7B fine-tuné dépasse GPT-4 et affiche des performances proches du niveau humain.
- Fine-tuner GPT-3.5 pourrait donner de meilleurs résultats, mais à un coût très élevé.
- Le fine-tuning reste un processus expérimental, et le prompt engineering en particulier demande beaucoup de temps.
- Après fine-tuning sur un nouveau set de cartes, le modèle montre aussi une capacité de généralisation sur des sets inédits.
Rapport de terrain : méthode et apprentissage
- Construction des données
- Les données au format CSV de 17lands ont été converties en format texte pour les rendre adaptées au fine-tuning.
- Le formatage des données a été un processus difficile et expérimental.
- Exécution du fine-tuning
- En raison de problèmes d’accès aux GPU, des GPU ont été loués à l’heure sur Runpod.
- axolotl a été utilisé pour mettre en œuvre facilement l’optimisation du fine-tuning.
- Évaluation
- Il est important de définir des critères d’évaluation avant de commencer l’expérience.
- Définir des critères d’évaluation pour les modèles de langage peut être difficile.
Principaux enseignements
- Effet du fine-tuning
- Le fine-tuning sur de nouvelles données surpasse GPT-4 en précision et en coût.
- Le fine-tuning exige une démarche expérimentale pour être bien réalisé, et c’est une compétence spécialisée plus difficile à apprendre que le prompt engineering.
Informations supplémentaires liées à Magic
- Performances du bot de draft IA fine-tuné
- Une application d’assistance au draft a été développée à partir d’un modèle de draft connecté aux logs de Magic Arena.
- Le modèle fine-tuné génère les choix, tandis que GPT-4 fournit les explications.
- Des simulations avec plusieurs bots de draft IA ont montré des performances similaires à celles de drafteurs humains.
Avis de GN⁺
Le point le plus important de cet article est que les techniques de fine-tuning ont le potentiel de dépasser les performances des grands modèles de langage existants (comme GPT-4), tout en améliorant fortement la compréhension et l’efficacité de l’IA sur des tâches spécifiques. Ce texte est particulièrement intéressant parce qu’il montre, à travers un cas d’usage concret, le processus détaillé du fine-tuning et ses effets ; il peut ainsi aider même des ingénieurs logiciel débutants à mieux comprendre le potentiel d’évolution des technologies d’IA et leurs méthodes d’application.
1 commentaires
Commentaires sur Hacker News