2 points par GN⁺ 2023-10-05 | 1 commentaires | Partager sur WhatsApp
  • Article expliquant comment extraire des recommandations de livres à partir de fils Hacker News (HN) à l’aide de l’API ChatGPT
  • L’auteur a analysé près de 200 histoires HN dont le titre contenait le mot "book" et qui ne pointaient pas vers d’autres pages
  • L’auteur a utilisé l’API GPT pour classer les données et produire les informations au format JSON
  • Les données ont été récupérées via l’API Hacker News, puis l’auteur a appelé l’API Chat Completions pour extraire du texte les titres de livres, auteurs et URL
  • Les 50 principales recommandations de livres ont été listées, avec "Structure and Interpretation of Computer Programs" d’Abelson et Sussman en tête
  • Il a été constaté que l’API ne renvoyait pas toujours un JSON valide, notamment lorsque ChatGPT répondait à un commentaire comme "thanks" ou posait une question
  • L’auteur a conçu le prompt pour écarter les réponses sans titre, car ChatGPT mentionnait parfois un auteur sans indiquer le titre du livre correspondant
  • Le traitement de 57k commentaires avec l’API GPT 3.5 Turbo a coûté environ 40 $
  • L’auteur a constaté que les résultats de GPT variaient d’un appel à l’autre même avec une température à 0, avec une variabilité plus forte que sur les anciens modèles GPT-3
  • L’auteur a découvert que GPT pouvait identifier des liens dans le texte, mais qu’il fallait supprimer les balises HTML pour éviter qu’il ne sélectionne un texte de lien tronqué à la place de l’URL
  • L’auteur a partagé un exemple de sortie JSON produite par ChatGPT ainsi que le prompt utilisé pour cette tâche
  • Les données brutes générées par GPT ont été partagées, triées par titre, pour permettre une analyse complémentaire
  • À titre d’exercice d’apprentissage, l’auteur a ajouté des liens d’affiliation Amazon aux URL Amazon du tableau

1 commentaires

 
GN⁺ 2023-10-05
Avis Hacker News
  • Article sur l’extraction d’informations de recommandations de livres sur Hacker News à l’aide de l’API ChatGPT
  • Certains utilisateurs ont signalé que ChatGPT avait manqué quelques recommandations de livres
  • Un utilisateur a recherché des recommandations de livres sur Hacker News avec le mot-clé "books" et a salué la qualité des recommandations trouvées sur la plateforme
  • Des utilisateurs ont mentionné d’autres ressources de recommandations de livres, comme Hacker Recommended Books et Hacker News Books
  • Certains utilisateurs se sont dits surpris que des ouvrages comme Code de Charles Petzold et les livres de Knuth ne figurent pas dans le top 50
  • Des inquiétudes ont été exprimées quant à la qualité des recommandations de livres générées par l’IA, certains suggérant qu’elles pourraient servir à générer des liens d’affiliation Amazon
  • Certains utilisateurs ont remis en question la présence dans la liste de livres comme How to Win Friends and Influence People et Atlas Shrugged
  • Un utilisateur a indiqué que Meditations de Marcus Aurelius avait peut-être été confondu avec Meditations on First Philosophy de Descartes, ce qui pourrait expliquer une erreur dans la liste
  • Certains utilisateurs ont trouvé de la valeur dans des recommandations de livres moins populaires découvertes dans les commentaires des publications Hacker News
  • Certains se sont interrogés sur la nécessité d’utiliser ChatGPT, estimant qu’Algolia et l’analyse de données suffisaient