OpenVoice v2 - clonage vocal instantané polyvalent

xguru · 2024-04-29T09:31:01+09:00

Avec la sortie de la v2, meilleure qualité audio, prise en charge multilingue incluant le coréen, et utilisation commerciale gratuite Possibilité de cloner une voix à partir d’un simple court clip audio du locuteur et de générer de la parole dans plusieurs langues Permet non seulement de reproduire le timbre du locuteur de référence, mais aussi de contrôler finement le style vocal, notamment l’émotion, l’intonation, le rythme, les pauses et l’accentuation Réalise un clonage vocal multilingue cross-lingue en zero-shot, même pour des langues non incluses dans l’ensemble d’entraînement Offre d’excellentes performances avec un coût de calcul des dizaines de fois inférieur à celui des API disponibles commercialement Changements de la V2 (sortie en 2024/04), qui inclut toutes les fonctionnalités de la V1 Meilleure qualité audio : la V2 adopte une stratégie d’entraînement différente offrant une meilleure qualité audio Prise en charge multilingue native : l’anglais, l’espagnol, le français, le chinois, le japonais et le coréen sont pris en charge nativement dans OpenVoice V2 Utilisation commerciale gratuite : depuis avril 2024, la V2 et la V1 sont toutes deux publiées sous licence MIT, ce qui permet aussi une utilisation commerciale gratuite

(github.com/myshell-ai)

34 points par xguru 2024-04-29 | 1 commentaires | Partager sur WhatsApp

Avec la sortie de la v2, meilleure qualité audio, prise en charge multilingue incluant le coréen, et utilisation commerciale gratuite
Possibilité de cloner une voix à partir d’un simple court clip audio du locuteur et de générer de la parole dans plusieurs langues
Permet non seulement de reproduire le timbre du locuteur de référence, mais aussi de contrôler finement le style vocal, notamment l’émotion, l’intonation, le rythme, les pauses et l’accentuation
Réalise un clonage vocal multilingue cross-lingue en zero-shot, même pour des langues non incluses dans l’ensemble d’entraînement
Offre d’excellentes performances avec un coût de calcul des dizaines de fois inférieur à celui des API disponibles commercialement
Changements de la V2 (sortie en 2024/04), qui inclut toutes les fonctionnalités de la V1
- Meilleure qualité audio : la V2 adopte une stratégie d’entraînement différente offrant une meilleure qualité audio
- Prise en charge multilingue native : l’anglais, l’espagnol, le français, le chinois, le japonais et le coréen sont pris en charge nativement dans OpenVoice V2
- Utilisation commerciale gratuite : depuis avril 2024, la V2 et la V1 sont toutes deux publiées sous licence MIT, ce qui permet aussi une utilisation commerciale gratuite

1 commentaires

xguru 2024-04-29

GN⁺ : OpenVoice : une technologie de clonage vocal instantané polyvalente
GN⁺ : OpenVoice - une technologie de clonage vocal instantané polyvalente

Le sujet a déjà été publié plusieurs fois via GN+, mais avec l’arrivée de la V2, la prise en charge multilingue est désormais disponible et le coréen a également été ajouté.

OpenVoice v2 - clonage vocal instantané polyvalent

À lire aussi

1 commentaires