- Avec la sortie de la v2, meilleure qualité audio, prise en charge multilingue incluant le coréen, et utilisation commerciale gratuite
- Possibilité de cloner une voix à partir d’un simple court clip audio du locuteur et de générer de la parole dans plusieurs langues
- Permet non seulement de reproduire le timbre du locuteur de référence, mais aussi de contrôler finement le style vocal, notamment l’émotion, l’intonation, le rythme, les pauses et l’accentuation
- Réalise un clonage vocal multilingue cross-lingue en zero-shot, même pour des langues non incluses dans l’ensemble d’entraînement
- Offre d’excellentes performances avec un coût de calcul des dizaines de fois inférieur à celui des API disponibles commercialement
- Changements de la V2 (sortie en 2024/04), qui inclut toutes les fonctionnalités de la V1
- Meilleure qualité audio : la V2 adopte une stratégie d’entraînement différente offrant une meilleure qualité audio
- Prise en charge multilingue native : l’anglais, l’espagnol, le français, le chinois, le japonais et le coréen sont pris en charge nativement dans OpenVoice V2
- Utilisation commerciale gratuite : depuis avril 2024, la V2 et la V1 sont toutes deux publiées sous licence MIT, ce qui permet aussi une utilisation commerciale gratuite
1 commentaires
GN⁺ : OpenVoice : une technologie de clonage vocal instantané polyvalente
GN⁺ : OpenVoice - une technologie de clonage vocal instantané polyvalente
Le sujet a déjà été publié plusieurs fois via GN+, mais avec l’arrivée de la V2, la prise en charge multilingue est désormais disponible et le coréen a également été ajouté.