5 points par GN⁺ 2024-01-04 | 1 commentaires | Partager sur WhatsApp
  • Réponse à la question d’un lecteur sur la manière d’effectuer gratuitement de l’OCR sur Mac avec le CLI ou Python.
  • Partage d’une méthode pour configurer gratuitement un « service » d’OCR local sur Mac via le terminal, le CLI ou Python.
  • Ouvrir l’app Shortcuts, créer un nouveau raccourci, puis faire glisser l’action "Extract Text from Image" afin de configurer l’extraction de texte depuis une image.
  • Sélectionner "Shortcut Input" et placer l’action "Copy to Clipboard" sous l’action "Extract text from ...".
  • Donner un nom au raccourci, puis lancer l’OCR depuis le terminal avec la commande shortcuts run ocr-text -i <chemin_de_l’image>.
  • En Python, utiliser le module subprocess pour exécuter l’OCR et afficher le résultat.

L’avis de GN⁺

  • Cet article fournit des informations utiles aux utilisateurs de Mac en proposant une manière d’utiliser gratuitement les fonctions d’OCR, ce qui peut améliorer l’efficacité du travail sur les documents.
  • Grâce à une configuration simple via l’app Shortcuts, il est possible d’extraire le texte présent dans une image, ce qui le rend facilement accessible même aux utilisateurs sans connaissances en programmation.
  • En présentant une méthode pour mettre en place un processus d’automatisation avec Python, l’article offre aussi un contenu attractif pour les développeurs.

1 commentaires

 
GN⁺ 2024-01-04
Avis Hacker News
  • Expérience impressionnante avec le framework Vision d’Apple

    • L’auteur du post original (OP) a utilisé le framework Vision d’Apple dans un projet personnel consistant à faire de l’OCR sur des dizaines de milliers de captures d’écran de feuilles de calcul afin de les importer dans une base de données Postgres.
    • Comme macOS et Nvidia ne sont pas compatibles, il a essayé d’autres méthodes d’OCR sur CPU, mais des outils comme Tesseract produisaient souvent des résultats erronés.
    • Le framework Vision a fourni les résultats de la meilleure qualité qu’il ait vus, tout en utilisant le moins de ressources de calcul.
    • Il y avait des problèmes de stabilité avec le framework, mais cela pouvait venir d’erreurs dans la manière dont l’utilisateur l’avait implémenté.
    • Il a utilisé une combinaison de vision.py de RHetTbull et de ocrmac, et se dit satisfait des performances sur un Hackintosh i7 6700k.
    • Il n’est pas programmeur, mais avec assez de temps il arrive à résoudre les problèmes, même si cela prend beaucoup de temps.
  • Expérience similaire sous Windows et outil OCR de Microsoft PowerToys

    • Un autre utilisateur a tenté un travail similaire sous Windows et a découvert que PowerToys, un projet Microsoft déjà installé, incluait un très bon outil d’OCR.
    • En appuyant sur Win+Shift+T puis en sélectionnant la zone à analyser, le texte est copié dans le presse-papiers.
  • Outil OCR open source gratuit

    • Un utilisateur a développé un outil OCR open source gratuit proposant à la fois une interface CLI et une interface UI.
  • Fonction OCR automatique des applications Mac

    • Un utilisateur a remarqué que de nombreuses applications Mac, comme Safari, Preview et Notes, effectuent automatiquement de l’OCR sur les images, ce qui permet de sélectionner facilement le texte dans l’image pour le copier-coller ailleurs.
  • Éloges pour un petit outil OCR sur Mac

    • Un utilisateur se dit grand fan d’un petit outil OCR installé sur son Macbook via brew.
  • Outil OCR recommandé pour Windows : Text Extractor de PowerToys

    • Un commentaire recommande aux utilisateurs Windows d’essayer Text Extractor de PowerToys.
  • Fonction OCR native de macOS Ventura

    • À partir de macOS Ventura, une fonction OCR native est intégrée à l’interface de capture d’image, et lors d’un scan en PDF avec un scanner compatible AirPrint, une case à cocher OCR apparaît dans le panneau de droite.
  • Solution d’extraction de texte avec PyXA

    • PyXA propose une solution pour extraire du texte d’une ou plusieurs images à la fois à l’aide du framework Vision.
    • Comme cela ne représente qu’une partie du package, cela peut être excessif pour un besoin ponctuel, mais c’est présenté comme une option.
  • Fonction de recherche et de copie de texte dans les images de Raycast

    • Raycast, disponible uniquement sur macOS, permet de rechercher du texte dans les images et de copier ce texte.
    • Un lien vers une vidéo de démonstration officielle est fourni.
  • Question sur une technologie similaire à la fonction « Copy Subject » d’Apple Vision

    • Un utilisateur explique qu’il dépend fortement de la fonction « Copy Subject » d’Apple Vision, qu’il juge très peu accessible, et demande s’il existe une technologie similaire.