3 points par hcmhcs0 2026-03-16 | 2 commentaires | Partager sur WhatsApp

Bonjour, je suis un étudiant développeur !

En ce moment, je m’intéresse aux agents IA, et j’étudiais en disséquant les directives système publiées sur OpenClaw. Je me demandais pourquoi les agents produisent des résultats bien meilleurs qu’un simple raisonnement de LLM, et de quelles directives système et structures ils sont composés. (Je voulais construire un agent IA adapté à ma situation pour gagner en productivité, haha.) Mais dans vscode, les directives système dans le code sont toutes en anglais, et la documentation associée aussi. Du coup, comme je lisais en gardant un onglet de traduction ouvert, à faire des allers-retours et du copier-coller, le contexte se brisait sans cesse et j’avais du mal à me concentrer. C’était encore plus frustrant quand le texte n’était pas copiable, comme dans une image ou un PDF.

Puis, en regardant ScreenHint, que j’utilise souvent (une app qui permet d’épingler des captures à l’écran), je me suis dit : « avec cette UX, il suffirait de traduire directement la zone capturée ». Comme je suis étudiant, devoir payer une API de traduction à chaque fois était aussi un poids, donc je suis parti sur un fonctionnement on-device par défaut. Justement, grâce à Claude Code, j’ai pu implémenter rapidement cette idée, et c’est ainsi qu’est né mon premier projet open source.

ScreenTranslate — une app macOS qui, lorsque vous capturez l’écran, enchaîne immédiatement OCR → traduction. Elle reste dans la barre de menus et peut être utilisée directement avec un raccourci clavier.

Il y a essentiellement deux fonctions :

  1. Traduction de capture d’écran — raccourci clavier → glisser pour sélectionner une zone → reconnaissance via OCR puis popup de traduction
  2. Traduction de texte — sélectionner du texte → raccourci clavier → traduction immédiate (sans OCR)

C’est gratuit et open source (GPL v3). Le fonctionnement est on-device, donc aucune donnée de traduction n’est envoyée à un serveur.

Caractéristiques :

  • Basé sur Apple Vision OCR + Apple Translation, fonctionne sans Internet
  • Sensiblement plus rapide à l’usage que l’app DeepL par défaut. De la capture au popup de traduction, il faut environ 1 seconde
  • Si un moteur cloud est nécessaire, DeepL, Google Cloud et Azure peuvent être utilisés en BYOK (saisie directe de votre clé API)
  • Enregistrement de l’historique des traductions, copie automatique dans le presse-papiers
  • Prise en charge de 20 langues

Stack technique :

  • macOS 15+ / Swift 6 / SwiftUI / SwiftData
  • Flux interne : Vision(VNRecognizeTextRequest) → prétraitement des retours à la ligne → Translation ou API → popup
  • Aucune dépendance externe. Utilise uniquement les frameworks natifs Apple (prérequis : macOS 15+ ; compatible Apple Silicon et Intel)

GitHub : https://github.com/hcmhcs/screenTranslate
Vidéo de démonstration : https://www.youtube.com/watch?v=ItYNAyue7eo
Téléchargement : récupérez le DMG dans GitHub Releases, ou compilez-le vous-même (voir le fichier README.md)

Au départ, je l’ai développé légèrement pour mon usage personnel, donc c’est un peu embarrassant, mais j’ai l’impression que le résultat est plutôt réussi. J’ai donc même tenté un premier lancement sur Product Hunt, et je passe actuellement par un processus de mises à jour en recueillant les retours de vrais utilisateurs.
Comme c’est mon premier projet open source en solo, il y a sûrement beaucoup de points à améliorer. Je vous serais reconnaissant pour vos retours ou vos PR :)

2 commentaires

 
guarder 2026-03-24

Je l’utilise vraiment très bien !

 
hcmhcs0 2026-03-24

Merci pour votre chaleureux commentaire ! Justement, en ce moment, je continue à peaufiner toutes sortes de choses pour améliorer la facilité d’utilisation, donc savoir que vous l’utilisez avec satisfaction est vraiment une grande source de motivation. :) Si jamais vous rencontrez un point gênant en l’utilisant, n’hésitez pas à m’en parler à tout moment !