Voice-Pro – une WebUI Gradio compatible avec la reconnaissance vocale, la traduction et la synthèse vocale
(github.com/abus-aikorea)Voice-Pro est une WebUI Gradio prenant en charge la reconnaissance vocale, la traduction et la synthèse vocale.
Fonctionnalités principales :
- Clonage de voix zero-shot. Un échantillon vocal de 15 secondes suffit. Plus de 50 voix de célébrités sont proposées
- Téléchargement de l’audio YouTube
- Séparation vocale
- Conversion texte-vers-parole multilingue (Edge-TTS, F5-TTS)
- Traduction multilingue
- Prise en charge de plusieurs moteurs Whisper (Whisper, Faster-Whisper, Whisper-Timestamped)
Démo vidéo :
-
Tutoriel d’utilisation de Voice-Pro : https://youtu.be/z8g8LMhoh_o
-
Démo de création de podcast avec Voice-Cloning : https://youtu.be/Wfo7vQCD4no
-
Démo et vidéos d’exemple : https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1 commentaires
On dirait que c’est quelqu’un de Corée qui l’a créé.