- Article de recherche publié par Google Research
- Génère une musique très fidèle à la description textuelle : « une mélodie de violon apaisante sur un riff de guitare saturé »
- Génère une musique de plusieurs minutes en 24 kHz en la formulant comme une tâche de modélisation hiérarchique entre séquences
- Surpasse largement les systèmes existants en qualité audio comme en respect de la description textuelle
- Peut aussi transformer le style de mélodies sifflées ou fredonnées
- Il est possible de générer de l’audio en mode narratif en fournissant plusieurs prompts de manière séquentielle
- Publication du jeu de données MusicCaps, composé de 5,5 k paires musique-texte
Aucun commentaire pour le moment.