Scrapeghost - Bibliothèque de web scraping utilisant GPT

xguru · 2023-03-28T10:30:02+09:00

Bibliothèque expérimentale qui extrait des données à partir de HTML sans écrire le moindre code spécifique à la page Il suffit de définir le format des données à extraire puis de fournir l’URL, et l’extraction se fait automatiquement En interne, elle effectue du nettoyage et du découpage du HTML pour réduire les coûts, et vérifie aussi les hallucinations afin de s’assurer que les données extraites correspondent bien à des valeurs réellement présentes sur la page Propose une fonction de définition de budget pour le coût des appels à l’API GPT

(jamesturk.github.io)

20 points par xguru 2023-03-28 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Bibliothèque expérimentale qui extrait des données à partir de HTML sans écrire le moindre code spécifique à la page
Il suffit de définir le format des données à extraire puis de fournir l’URL, et l’extraction se fait automatiquement
En interne, elle effectue du nettoyage et du découpage du HTML pour réduire les coûts, et vérifie aussi les hallucinations afin de s’assurer que les données extraites correspondent bien à des valeurs réellement présentes sur la page
Propose une fonction de définition de budget pour le coût des appels à l’API GPT

Scrapeghost - Bibliothèque de web scraping utilisant GPT

À lire aussi

Aucun commentaire pour le moment.