Imagen - le modèle de diffusion text-to-image de Google

xguru · 2022-05-25T09:32:41+09:00

Un modèle d’IA qui comprend le langage en profondeur pour générer des images réalistes Lors d’évaluations menées auprès de personnes, il génère des images jugées préférables à celles de DALL-E 2 d’OpenAI → en termes de qualité et d’alignement image-texte Seuls l’article de recherche et des exemples d’images ont été publiés → une version de démonstration accessible en externe ne sera pas publiée en raison de problèmes éthiques, entre autres

(imagen.research.google)

10 points par xguru 2022-05-25 | 2 commentaires | Partager sur WhatsApp

Un modèle d’IA qui comprend le langage en profondeur pour générer des images réalistes
Lors d’évaluations menées auprès de personnes, il génère des images jugées préférables à celles de DALL-E 2 d’OpenAI
→ en termes de qualité et d’alignement image-texte
Seuls l’article de recherche et des exemples d’images ont été publiés
→ une version de démonstration accessible en externe ne sera pas publiée en raison de problèmes éthiques, entre autres

2 commentaires

kunggom 2022-05-25

Hier, dans une librairie, j’ai vu un exemplaire d’Alice au pays des merveilles avec des images fixes d’animation Disney insérées comme illustrations, et je me demande quel résultat produirait ce type de modèle si l’on lui donnait en entrée chaque scène d’Alice au pays des merveilles.

xguru 2022-05-25

Présentation de DALL·E 2
Comment fonctionne DALL-E 2 ?

Imagen - le modèle de diffusion text-to-image de Google

À lire aussi

2 commentaires