- Bibliothèque expérimentale qui extrait des données à partir de HTML sans écrire le moindre code spécifique à la page
- Il suffit de définir le format des données à extraire puis de fournir l’URL, et l’extraction se fait automatiquement
- En interne, elle effectue du nettoyage et du découpage du HTML pour réduire les coûts, et vérifie aussi les hallucinations afin de s’assurer que les données extraites correspondent bien à des valeurs réellement présentes sur la page
- Propose une fonction de définition de budget pour le coût des appels à l’API GPT
Aucun commentaire pour le moment.