- Génère des extraits audio de haute qualité dans divers styles, à l’image des IA de génération d’images et de texte
- Permet aussi de modifier un échantillon audio donné
- En plus de synthétiser la parole dans 6 langues, il peut supprimer le bruit, éditer le contenu, changer de style et générer divers échantillons
- Les IA génératives vocales existantes nécessitaient jusqu’ici des données d’entraînement soigneusement préparées pour chaque tâche. Voicebox utilise une nouvelle méthode et est entraîné à partir de données audio brutes et de transcriptions
- Entraîné à partir de plus de 50�00 heures de livres audio du domaine public en anglais, français, espagnol, allemand, polonais et portugais
2 commentaires
Je me demande si cela pourrait servir à retirer uniquement les voix d’une chanson pour créer un MR de haute qualité.
Il existe déjà un open source tout à fait utilisable pour ça :
https://github.com/Anjok07/ultimatevocalremovergui