15 points par xguru 2024-11-14 | 2 commentaires | Partager sur WhatsApp
  • Crawl un site web et le convertit en Markdown ou en données structurées utilisables par les LLM
  • En envoyant une URL via l'API, il explore toutes les sous-pages et fournit des données propres pour chacune d'elles
  • SDK disponibles pour Python, Node, Go et Rust
  • Intégration prise en charge avec LangChain, Llama Index, Dify, Langflow et Zapier

2 commentaires

 
hoonix 2024-11-15

Il ne prend pas en charge le crawl des sous-pages, mais je vous présente un convertisseur de formats de documents visant un objectif similaire.
https://github.com/DS4SD/docling

 
laeyoung 2024-11-14

Ça ne marche pas très bien comme on le souhaite.