- Article expliquant comment extraire des recommandations de livres à partir de fils Hacker News (HN) à l’aide de l’API ChatGPT
- L’auteur a analysé près de 200 histoires HN dont le titre contenait le mot "book" et qui ne pointaient pas vers d’autres pages
- L’auteur a utilisé l’API GPT pour classer les données et produire les informations au format JSON
- Les données ont été récupérées via l’API Hacker News, puis l’auteur a appelé l’API Chat Completions pour extraire du texte les titres de livres, auteurs et URL
- Les 50 principales recommandations de livres ont été listées, avec "Structure and Interpretation of Computer Programs" d’Abelson et Sussman en tête
- Il a été constaté que l’API ne renvoyait pas toujours un JSON valide, notamment lorsque ChatGPT répondait à un commentaire comme "thanks" ou posait une question
- L’auteur a conçu le prompt pour écarter les réponses sans titre, car ChatGPT mentionnait parfois un auteur sans indiquer le titre du livre correspondant
- Le traitement de 57k commentaires avec l’API GPT 3.5 Turbo a coûté environ 40 $
- L’auteur a constaté que les résultats de GPT variaient d’un appel à l’autre même avec une température à 0, avec une variabilité plus forte que sur les anciens modèles GPT-3
- L’auteur a découvert que GPT pouvait identifier des liens dans le texte, mais qu’il fallait supprimer les balises HTML pour éviter qu’il ne sélectionne un texte de lien tronqué à la place de l’URL
- L’auteur a partagé un exemple de sortie JSON produite par ChatGPT ainsi que le prompt utilisé pour cette tâche
- Les données brutes générées par GPT ont été partagées, triées par titre, pour permettre une analyse complémentaire
- À titre d’exercice d’apprentissage, l’auteur a ajouté des liens d’affiliation Amazon aux URL Amazon du tableau
1 commentaires
Avis Hacker News