Traducteur OCR - application Windows en rust/slint basée sur un VLM
(github.com/kirinonakar)Il s’agit d’un traducteur OCR pour Windows créé avec rust/slint.
Basé sur un VLM, il prend en charge Gemini et les modèles locaux. (LM Studio, API compatibles OpenAI, etc.)
Il propose de nombreuses fonctionnalités comme les raccourcis clavier, l’overlay, les zones de texte, la retraduction automatique, le presse-papiers, la modification des prompts et les styles.
En mode zone de texte, il est aussi possible de cliquer dans l’écran en cours de traduction.
Il convient bien à la traduction de jeux.
Parmi les modèles locaux, gemma-4-31b-it offre la meilleure qualité, et gemma-4-26b-a4b présente un bon équilibre entre vitesse et qualité.
qwen3.5 9 est rapide, mais donne une impression un peu en retrait.
On observe aussi quelques différences selon le prompt système.
Vous pouvez donner des consignes sur le style de traduction, et pour les noms propres par exemple, le fait de les saisir directement dans le prompt système fonctionne bien.
En changeant le prompt système, l’outil peut faire autre chose que de la traduction.
(créer du markdown ou du JSON, résumer, transformer un manga en roman, afficher la position des caractères, décrire une image, générer un prompt, évaluer le design d’une page web, etc.)
Les possibilités d’usage sont pratiquement infinies.
Pour des instructions d’utilisation détaillées, veuillez consulter GitHub.
https://github.com/kirinonakar/ocr_trans
Aucun commentaire pour le moment.