31 points par xguru 2025-10-04 | 1 commentaires | Partager sur WhatsApp
  • Application gratuite open source de conversion voix → texte fonctionnant entièrement hors ligne, une application de bureau Tauri basée sur Rust + React/TypeScript
  • Appui sur un raccourci clavier pour démarrer l’enregistrement → parler pour lancer une conversion locale sans envoi vers le cloud → saisie automatique du texte
  • Fonctionne avec les modèles Whisper et Parakeet V3 avec accélération GPU ou optimisation CPU, et prend en charge Windows, macOS, Linux
  • L’objectif du projet n’est pas de créer « l’application de reconnaissance vocale la plus parfaite », mais de construire l’application la plus facile à forker, que tout le monde peut facilement modifier et étendre, avec prise en charge open source, gratuite et hors ligne
  • Stack technique
    • Frontend : React + TypeScript + Tailwind CSS
    • Backend : basé sur Rust, responsable du traitement audio et de l’inférence en machine learning
    • Bibliothèques principales :
      • whisper-rs (reconnaissance vocale basée sur Whisper)
      • transcription-rs (modèle Parakeet optimisé pour le CPU)
      • cpal (audio I/O cross-platform)
      • vad-rs (détection d’activité vocale)
      • rdev (raccourcis globaux et gestion des événements)
      • rubato (rééchantillonnage audio)
  • Site officiel : https://handy.computer/

1 commentaires

 
shakespeares 2025-10-07

C'est génial.