- Une app de découverte de carrière basée sur l’IA a été créée, puis sa croissance explosive a fait grimper les coûts de GPT-4 à plus de 100 $ par jour
- Méthode utilisée pour réduire les coûts d’IA jusqu’à 99 % tout en diminuant la latence et en maintenant la qualité
- Utiliser d’abord le modèle le plus puissant (GPT-4) pour produire des résultats, puis s’en servir pour affiner un modèle plus petit
- Stocker les requêtes/réponses IA de façon à pouvoir les exporter facilement. Utilisation de Helicone AI. Il suffit de remplacer l’API OpenAI pour que les requêtes IA soient enregistrées dans une table
- Une fois environ 100 à 500 paires requête/réponse enregistrées, les exporter puis nettoyer les données pour obtenir une bonne qualité
- Utiliser ce jeu de données pour affiner Mixtral 8x7B via un service d’hébergement comme Together/Anyscale
- Remplacer GPT-4 par le nouveau modèle affiné
4 commentaires
Cela veut dire que les conditions d'utilisation de GPT-4 et la licence de Mixtral ont toutes les deux été violées... ? @_@
On dirait bien. Comme ce n’est pas quelque chose qui se voit au premier abord, beaucoup de gens semblent réagir ainsi.
On en voyait circuler de façon plus ou moins confidentielle, ou alors publiés pour la recherche,
mais le voir assumé aussi ouvertement avec un « oui, on l’a utilisé ! » mis en avant, c’est un peu... surprenant.
Ils ne vont rien leur reprocher... ?
Commentaires Hacker News