- Application gratuite open source de conversion voix → texte fonctionnant entièrement hors ligne, une application de bureau Tauri basée sur Rust + React/TypeScript
- Appui sur un raccourci clavier pour démarrer l’enregistrement → parler pour lancer une conversion locale sans envoi vers le cloud → saisie automatique du texte
- Fonctionne avec les modèles Whisper et Parakeet V3 avec accélération GPU ou optimisation CPU, et prend en charge Windows, macOS, Linux
- L’objectif du projet n’est pas de créer « l’application de reconnaissance vocale la plus parfaite », mais de construire l’application la plus facile à forker, que tout le monde peut facilement modifier et étendre, avec prise en charge open source, gratuite et hors ligne
- Stack technique
- Frontend : React + TypeScript + Tailwind CSS
- Backend : basé sur Rust, responsable du traitement audio et de l’inférence en machine learning
- Bibliothèques principales :
whisper-rs (reconnaissance vocale basée sur Whisper)
transcription-rs (modèle Parakeet optimisé pour le CPU)
cpal (audio I/O cross-platform)
vad-rs (détection d’activité vocale)
rdev (raccourcis globaux et gestion des événements)
rubato (rééchantillonnage audio)
- Site officiel : https://handy.computer/
1 commentaires
C'est génial.