- Permet de générer jusqu’à 47 secondes de données audio de haute qualité à partir de simples prompts textuels
- Grâce à un entraînement spécialisé, il est idéal pour créer des rythmes de batterie, des riffs instrumentaux, des sons d’ambiance, des enregistrements de bruitage et d’autres échantillons audio pour la production musicale et le sound design
- Le principal avantage de cette version open source est que les utilisateurs peuvent affiner le modèle sur leurs propres données audio personnalisées
- Par exemple, un batteur peut l’affiner sur ses propres échantillons d’enregistrements de batterie pour générer de nouveaux beats
- En quoi est-il différent de Stable Audio ?
- Stable Audio, le produit commercial, offre des pistes complètes de haute qualité allant jusqu’à 3 minutes avec une structure musicale cohérente, ainsi que des fonctions avancées comme la génération audio-vers-audio et la composition musicale cohérente en plusieurs parties
- À l’inverse, Stable Audio Open est spécialisé dans les échantillons audio, les effets sonores et les éléments de production
- Il peut générer de courts extraits musicaux, mais n’est pas optimisé pour des chansons complètes, des mélodies ou des voix
- Ce modèle ouvert fournit des perspectives sur l’IA générative appliquée au sound design, tout en donnant la priorité à un développement responsable avec la communauté créative
- Les poids du modèle Stable Audio Open sont disponibles sur Hugging Face
- Les sound designers, musiciens, développeurs et passionnés d’audio sont encouragés à télécharger le modèle, à explorer ses capacités et à faire part de leurs retours
Aucun commentaire pour le moment.