9 points par vulcanidic 2024-12-08 | 1 commentaires | Partager sur WhatsApp

Voice-Pro est une WebUI Gradio prenant en charge la reconnaissance vocale, la traduction et la synthèse vocale.

Fonctionnalités principales :

  • Clonage de voix zero-shot. Un échantillon vocal de 15 secondes suffit. Plus de 50 voix de célébrités sont proposées
  • Téléchargement de l’audio YouTube
  • Séparation vocale
  • Conversion texte-vers-parole multilingue (Edge-TTS, F5-TTS)
  • Traduction multilingue
  • Prise en charge de plusieurs moteurs Whisper (Whisper, Faster-Whisper, Whisper-Timestamped)

Démo vidéo :

GitHub :
https://github.com/abus-aikorea/voice-pro

1 commentaires

 
yangeok 2024-12-16

On dirait que c’est quelqu’un de Corée qui l’a créé.