- Utilise SD 1.5 tel quel et affine le modèle pour générer des images de spectrogrammes à l’aide de img2txt
- Les images générées peuvent être converties en clips audio lisibles
- Possibilité de modifier le son avec img2img
- Interpolation de courts clips audio pour permettre une boucle infinie
- Disponible sous forme de web app pour une utilisation simple, avec le code également publié (Next.js + React + Three.js + Tailwind)
Spectrogramme : forme d’onde + spectre
- Représentation visuelle du spectre d’un son à l’aide de la fréquence, de l’amplitude (intensité) et du temps
- Peut être calculé à partir de l’audio avec la STFT (Short-Time Fourier Transform)
Aucun commentaire pour le moment.