Publication de Stable Audio Open, un modèle open source pour les échantillons audio et le sound design

xguru · 2024-06-08T09:31:01+09:00

Permet de générer jusqu’à 47 secondes de données audio de haute qualité à partir de simples prompts textuels Grâce à un entraînement spécialisé, il est idéal pour créer des rythmes de batterie, des riffs instrumentaux, des sons d’ambiance, des enregistrements de bruitage et d’autres échantillons audio pour la production musicale et le sound design Le principal avantage de cette version open source est que les utilisateurs peuvent affiner le modèle sur leurs propres données audio personnalisées Par exemple, un batteur peut l’affiner sur ses propres échantillons d’enregistrements de batterie pour générer de nouveaux beats En quoi est-il différent de Stable Audio ? Stable Audio, le produit commercial, offre des pistes complètes de haute qualité allant jusqu’à 3 minutes avec une structure musicale cohérente, ainsi que des fonctions avancées comme la génération audio-vers-audio et la composition musicale cohérente en plusieurs parties À l’inverse, Stable Audio Open est spécialisé dans les échantillons audio, les effets sonores et les éléments de production Il peut générer de courts extraits musicaux, mais n’est pas optimisé pour des chansons complètes, des mélodies ou des voix Ce modèle ouvert fournit des perspectives sur l’IA générative appliquée au sound design, tout en donnant la priorité à un développement responsable avec la communauté créative Les poids du modèle Stable Audio Open sont disponibles sur Hugging Face Les sound designers, musiciens, développeurs et passionnés d’audio sont encouragés à télécharger le modèle, à explorer ses capacités et à faire part de leurs retours

(stability.ai)

7 points par xguru 2024-06-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Permet de générer jusqu’à 47 secondes de données audio de haute qualité à partir de simples prompts textuels
Grâce à un entraînement spécialisé, il est idéal pour créer des rythmes de batterie, des riffs instrumentaux, des sons d’ambiance, des enregistrements de bruitage et d’autres échantillons audio pour la production musicale et le sound design
Le principal avantage de cette version open source est que les utilisateurs peuvent affiner le modèle sur leurs propres données audio personnalisées
- Par exemple, un batteur peut l’affiner sur ses propres échantillons d’enregistrements de batterie pour générer de nouveaux beats
En quoi est-il différent de Stable Audio ?
- Stable Audio, le produit commercial, offre des pistes complètes de haute qualité allant jusqu’à 3 minutes avec une structure musicale cohérente, ainsi que des fonctions avancées comme la génération audio-vers-audio et la composition musicale cohérente en plusieurs parties
- À l’inverse, Stable Audio Open est spécialisé dans les échantillons audio, les effets sonores et les éléments de production
  - Il peut générer de courts extraits musicaux, mais n’est pas optimisé pour des chansons complètes, des mélodies ou des voix
  - Ce modèle ouvert fournit des perspectives sur l’IA générative appliquée au sound design, tout en donnant la priorité à un développement responsable avec la communauté créative
Les poids du modèle Stable Audio Open sont disponibles sur Hugging Face
- Les sound designers, musiciens, développeurs et passionnés d’audio sont encouragés à télécharger le modèle, à explorer ses capacités et à faire part de leurs retours

Publication de Stable Audio Open, un modèle open source pour les échantillons audio et le sound design

À lire aussi

Aucun commentaire pour le moment.