Stable Diffusion - open source de génération d’images à partir de texte, similaire à DALL-E
(github.com/CompVis)- Modèle de diffusion latente entraîné sur des images 512x512 de la base de données LAION-5B
- Utilise l’encodeur de texte CLIP ViT-L/14, à l’image de l’Imagen de Google
- Suffisamment léger pour fonctionner avec un seul GPU disposant de plus de 10 Go de VRAM
- Collaboration et soutien de chercheurs de Stability AI et de LAION
Aucun commentaire pour le moment.