- Entièrement gratuit et open source. Aucun abonnement, aucune fonctionnalité payante, aucun code caché
- S’applique avec flexibilité, du traitement de haute qualité de manuscrits complexes à la reconnaissance intégrale de texte à grande échelle pour des imprimés
- Prise en charge puissante de l’annotation de mise en page et de texte
- Utilisez l’éditeur LAREX pour annoter manuellement, corriger ou comparer la mise en page et les éléments textuels
- Entièrement compatible avec l’écosystème OCR-D
- Conçu en pensant à l’utilisabilité : permet de créer via l’UI des workflows OCR complexes sans utiliser de code ni de CLI
- Développement cross-platform facile : exécutable avec Docker et une seule commande, quel que soit l’OS
1 commentaires
Avis Hacker News
Les pipelines de segmentation complexes étaient nécessaires il y a quelques années, mais ils génèrent désormais beaucoup d’erreurs et privent les modèles d’un contexte important. Pour passer au manuscrit, le contexte est indispensable
OCR4all est un logiciel destiné à la récupération et à la reconnaissance de texte numérique pour les imprimés du début de l’époque moderne
OCR4all répond de manière claire et intuitive aux besoins des utilisateurs non techniques
Le Vision Framework d’Apple fournit une bibliothèque de reconnaissance de texte plus rapide et plus précise que Tesseract
Combiner Tesseract et des LLM pour corriger les erreurs et améliorer la mise en forme constitue actuellement le meilleur compromis en matière de vitesse, d’efficacité et de précision
Une API OCR assistée par IA a été développée
Ce workflow sert à numériser des documents imprimés historiques
OCR4all combine diverses solutions open source pour fournir un workflow de reconnaissance automatique de texte
On se demande s’il s’agit d’un nouveau moteur OCR SOTA ou d’un outil qui utilise d’autres moteurs déjà connus
On pensait que l’OCR était en grande partie résolu avec Tesseract, mais quelqu’un cherche une bibliothèque ou une implémentation pour la compression MRC des PDF résultants