- Sur HN, l’intérêt pour l’affinage des LLM open source a fortement augmenté (par ex. le post d’Anyscale)
- Partage de plusieurs années d’expérience et d’enseignements sur l’affinage de modèles, ainsi que de code pratique
- Mise à disposition d’un ensemble de notebooks couvrant l’annotation des données, l’affinage, l’exécution efficace de l’inférence et l’évaluation coût/performance
- Entraînement d’un modèle 7B qui reproduit à 95 % les labels de GPT-4 sur un ensemble de test
- Qu’est-ce que l’affinage ? Une forme de prompting plus puissante que le simple fait d’écrire des instructions en texte
- On entraîne un modèle existant à partir de paires d’entrées/sorties d’exemple pour former un modèle affiné
- Avantages et inconvénients du prompting et de l’affinage
- Grand avantage de l’affinage : bien plus efficace pour guider le comportement du modèle, ce qui permet d’utiliser des modèles beaucoup plus petits
- Un modèle Llama 7B affiné coûte 50 fois moins cher par token que GPT-3.5 et fournit des résultats équivalents ou meilleurs dans de nombreux cas d’usage
- Exemple : classifier 2M de recettes avec GPT-4 coûte 23k $, tandis que notre modèle affiné affiche des performances similaires à GPT-4 et ne coûte que 19 $ pour traiter l’ensemble du jeu de données
- Développement en cours d’un produit open source appelé OpenPipe
- Le produit OpenPipe aide les ingénieurs à adopter l’affinage aussi simplement que possible
- Ce post vise à partager ce qu’ils ont appris sur l’affinage
1 commentaires
Avis Hacker News