- Un outil open source qui numérise, indexe et archive les documents pour en faire une archive en ligne consultable
- Fork de
paperless-ng, dont la maintenance a été interrompue, avec poursuite des mises à niveau et de la maintenance
- Effectue l'OCR des documents pour ajouter du texte recherchable, ainsi que des tags et des types
- Prend en charge les PDF, les images, le texte brut et les documents bureautiques (Word, Excel, PowerPoint et fichiers LibreOffice)
- Les documents restent stockés tels quels dans le système de fichiers, et Paperless gère les noms de fichiers/dossiers
- Front end SPA : tableau de bord, filtrage et vues personnalisables
- Prise en charge de la recherche plein texte : autocomplétion, tri par pertinence de la requête, mise en évidence des passages correspondants dans les documents, recherche de documents similaires
- Peut aussi ajouter automatiquement les documents présents dans plusieurs comptes e-mail
- Correspondance de documents basée sur le machine learning
- Optimisé pour les systèmes multicœurs
2 commentaires
Comme il s’agit d’un article de présentation d’un projet open source, j’ai résumé le contenu du dépôt https://github.com/paperless-ngx/paperless-ngx.
Avis Hacker News