34 points par xguru 2024-04-29 | 1 commentaires | Partager sur WhatsApp
  • Avec la sortie de la v2, meilleure qualité audio, prise en charge multilingue incluant le coréen, et utilisation commerciale gratuite
  • Possibilité de cloner une voix à partir d’un simple court clip audio du locuteur et de générer de la parole dans plusieurs langues
  • Permet non seulement de reproduire le timbre du locuteur de référence, mais aussi de contrôler finement le style vocal, notamment l’émotion, l’intonation, le rythme, les pauses et l’accentuation
  • Réalise un clonage vocal multilingue cross-lingue en zero-shot, même pour des langues non incluses dans l’ensemble d’entraînement
  • Offre d’excellentes performances avec un coût de calcul des dizaines de fois inférieur à celui des API disponibles commercialement
  • Changements de la V2 (sortie en 2024/04), qui inclut toutes les fonctionnalités de la V1
    • Meilleure qualité audio : la V2 adopte une stratégie d’entraînement différente offrant une meilleure qualité audio
    • Prise en charge multilingue native : l’anglais, l’espagnol, le français, le chinois, le japonais et le coréen sont pris en charge nativement dans OpenVoice V2
    • Utilisation commerciale gratuite : depuis avril 2024, la V2 et la V1 sont toutes deux publiées sous licence MIT, ce qui permet aussi une utilisation commerciale gratuite

1 commentaires

 
xguru 2024-04-29

GN⁺ : OpenVoice : une technologie de clonage vocal instantané polyvalente
GN⁺ : OpenVoice - une technologie de clonage vocal instantané polyvalente

Le sujet a déjà été publié plusieurs fois via GN+, mais avec l’arrivée de la V2, la prise en charge multilingue est désormais disponible et le coréen a également été ajouté.