- Lors du développement d’un modèle d’IA, la quantité comme la qualité du dataset sont toutes deux importantes
- En utilisant ChatGPT, il est possible de constituer un dataset à faible coût, tout en gagnant du temps par rapport au recours à un prestataire de labellisation
- Poser les requêtes en anglais permet non seulement de réduire les coûts (en économisant des tokens), mais offre aussi de meilleures performances
- Dans les situations courantes, il est avantageux d’abaisser
temperature à 0 afin d’obtenir des réponses cohérentes
- Définir de manière appropriée le comportement associé aux rôles (
user, assistant, system)
- D’après un calcul simple, 3 dollars suffisent pour labelliser environ 10
000 entrées d’un dataset d’analyse de sentiments (sur la base du modèle
gpt-3.5-turbo)
Aucun commentaire pour le moment.