DeepFloyd IF - modèle open source de text-to-image
(github.com/deep-floyd)- Nouveau modèle d’image de Stability AI
- Meilleure compréhension du langage que les modèles existants, et génération d’images photoréalistes
- Combinaison d’un encodeur de texte Frozen basé sur le Transformer T5 et d’un module de diffusion par pixels en 3 étapes
- 64x64, 256x256, 1024x1024px
- Score FID zero-shot de 6,66 (jeu de données COCO)
Aucun commentaire pour le moment.