Imagen - le modèle de diffusion text-to-image de Google
(imagen.research.google)- Un modèle d’IA qui comprend le langage en profondeur pour générer des images réalistes
- Lors d’évaluations menées auprès de personnes, il génère des images jugées préférables à celles de DALL-E 2 d’OpenAI
→ en termes de qualité et d’alignement image-texte - Seuls l’article de recherche et des exemples d’images ont été publiés
→ une version de démonstration accessible en externe ne sera pas publiée en raison de problèmes éthiques, entre autres
2 commentaires
Hier, dans une librairie, j’ai vu un exemplaire d’Alice au pays des merveilles avec des images fixes d’animation Disney insérées comme illustrations, et je me demande quel résultat produirait ce type de modèle si l’on lui donnait en entrée chaque scène d’Alice au pays des merveilles.
Présentation de DALL·E 2
Comment fonctionne DALL-E 2 ?