Documind - outil d’IA open source pour convertir des documents PDF en données structurées
(github.com/DocumindHQ)- Offre des fonctions de conversion de PDF, d’extraction d’informations et de formatage des résultats selon un schéma défini par l’utilisateur
- Convertit les PDF en images afin de permettre un traitement IA plus fin
- Utilise l’API d’OpenAI pour extraire et structurer les informations
- Permet de personnaliser les schémas d’extraction pour divers formats de documents
- Conçu pour être déployé avec flexibilité aussi bien en environnement local que dans le cloud
- Développé sur la base de Zerox
5 commentaires
C’est open source, certes, mais comme tout tourne surtout autour de l’IA en ce moment, c’est dommage qu’on ne voie pas sortir davantage d’outils légers et gratuits qu’on puisse vraiment utiliser...
Il est un peu ironique qu’un logiciel d’IA ultra-avancé dépende de Ghostscript, vieux de 40 ans… haha
Donc, on transforme du texte en PDF, puis le PDF en image, puis l’image en texte.
C’est un service en cours de développement en interne… et voilà qu’il sort en open source haha.
Votre entreprise serait-elle HK ?