3 points par GN⁺ 2024-03-17 | 1 commentaires | Partager sur WhatsApp
  • Téléchargement

    • TextSnatcher est une application qui permet de copier facilement du texte à partir d’images et d’effectuer des opérations d’OCR en quelques secondes.
  • Fonctionnalités

    • Prise en charge de nombreuses langues.
    • Fonction de copie de texte en le sélectionnant par glisser-déposer sur l’image.
    • Possibilité de glisser puis coller au-dessus de n’importe quelle image.
    • Utilisation rapide et simple.
    • Utilise Tesseract OCR 4.x pour la reconnaissance de caractères.
    • Il est possible d’en apprendre davantage sur Tesseract et de soutenir le projet Tesseract en lui attribuant une étoile.
  • Screencasts

    • textsnatcher-eng.mp4
    • textsnatcher-tamil.mp4
  • Captures d’écran

    • Captures d’écran de l’application disponibles.
  • Soutenir

    • Guide expliquant comment soutenir le développeur.
  • Publications sur les réseaux sociaux

    • Partage d’une publication LinkedIn expliquant pourquoi TextSnatcher a été créé.
  • Dépendances

    • Liste des dépendances nécessaires avant d’installer et d’exécuter l’application.
      • Dépendances à l’exécution : scrot, tesseract-ocr, données de langue Tesseract
      • Dépendances à la compilation : granite, gtk+-3.0, gobject-2.0, gdk-pixbuf-2.0, libhandy-1, libportal-0.5
  • Installation, compilation et exécution

    • Fournit les commandes pour cloner TextSnatcher depuis le dépôt GitHub, puis le compiler et l’installer avec Meson.
  • Inspiration

    • Le ReadMe de TextSnatcher, la structure de l’application, ainsi que l’application MacOS TextSniper ont servi d’inspiration.
    • Conçu avec ❤️ pour Linux.

L’avis de GN⁺

  • TextSnatcher est un outil simple pour extraire le texte contenu dans des images, et semble particulièrement utile pour les utilisateurs de Linux.
  • Par rapport à d’autres applications utilisant l’OCR, l’usage du moteur Tesseract OCR lui apporte les avantages d’un taux de reconnaissance élevé et d’une prise en charge de nombreuses langues.
  • En tant que projet open source, il offre aux développeurs la possibilité de consulter le code et d’y contribuer, et peut être continuellement amélioré grâce au soutien de la communauté.
  • Le fait que l’utilisateur doive le compiler et l’installer lui-même peut représenter une barrière à l’entrée pour certains utilisateurs non techniques, mais il s’agit d’une pratique courante dans la communauté Linux.
  • Lors de l’adoption de cette technologie, les utilisateurs doivent tenir compte de la gestion des dépendances et de la compatibilité système ; étant open source, on peut aussi s’attendre à des mises à jour continues en matière de sécurité et de stabilité.

1 commentaires

 
GN⁺ 2024-03-17
Avis Hacker News
  • Commentaires sur l’utilisation et la modification du script :

    • Un utilisateur indique que Dibby053 utilise un script copié depuis StackOverflow et l’a adapté pour fonctionner avec KDE, GNOME, Wayland et X11. Il aurait aussi ajouté une fonctionnalité de notification d’état.
    • Le script dépend de tesseract-ocr, imagemagick et d’autres outils ; selon l’environnement de l’utilisateur, il utilise différents utilitaires pour faire une capture d’écran, améliore la qualité de l’image afin d’augmenter le taux de reconnaissance de texte, puis copie le résultat dans le presse-papiers.
  • Commentaires sur l’efficacité de Tesseract :

    • Un utilisateur se demande si Tesseract relève vraiment de l’état de l’art et partage son expérience selon laquelle il ne convertit pas correctement les scans en basse résolution, en particulier pour les textes non anglophones.
    • Un autre utilisateur recommande aux utilisateurs de Windows l’outil de capture d’écran de Microsoft PowerToys, en insistant sur la praticité des raccourcis clavier.
    • Un utilisateur explique avoir été déçu par ses expériences passées avec Tesseract et se demande si la technologie s’est suffisamment améliorée pour qu’un post-traitement manuel soit presque inutile.
    • Un utilisateur dit avoir testé l’application Flatpak et estime que, même si le résultat n’est pas parfait, la plupart des textes nets sont bien reconnus.
  • Commentaires sur des solutions similaires sur d’autres plateformes :

    • Des avis positifs ont été exprimés au sujet d’un outil OCR pour macOS et de son développeur.
    • Sur iOS, il existerait une solution utilisant un raccourci pour prendre une capture d’écran, extraire le texte et le traduire. De plus, dans les versions récentes d’iOS, il est possible de sélectionner et copier directement le texte présent dans les photos depuis l’app Photos.
  • Commentaires sur les solutions pour desktop Linux :

    • Un utilisateur mentionne l’application Flatpak et dit que toutes les distributions Linux ne prennent pas en charge Flatpak, mais qu’il compte l’essayer sur une machine virtuelle Fedora. Il estime qu’il existe divers outils s’appuyant sur Tesseract, mais que les performances ne sont pas bonnes lorsque l’image contient beaucoup de bruit ou que le texte est déformé.