Comment constituer des données d’entraînement à bas coût avec ChatGPT
(blog.hashscraper.com)- Lors du développement d’un modèle d’IA, la quantité comme la qualité du dataset sont toutes deux importantes
- En utilisant ChatGPT, il est possible de constituer un dataset à faible coût, tout en gagnant du temps par rapport au recours à un prestataire de labellisation
- Poser les requêtes en anglais permet non seulement de réduire les coûts (en économisant des tokens), mais offre aussi de meilleures performances
- Dans les situations courantes, il est avantageux d’abaisser
temperatureà 0 afin d’obtenir des réponses cohérentes - Définir de manière appropriée le comportement associé aux rôles (
user,assistant,system) - D’après un calcul simple, 3 dollars suffisent pour labelliser environ 10
000 entrées d’un dataset d’analyse de sentiments (sur la base du modèle
gpt-3.5-turbo)
Aucun commentaire pour le moment.