11 points par xguru 2022-08-16 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Modèle de diffusion latente entraîné sur des images 512x512 de la base de données LAION-5B
  • Utilise l’encodeur de texte CLIP ViT-L/14, à l’image de l’Imagen de Google
  • Suffisamment léger pour fonctionner avec un seul GPU disposant de plus de 10 Go de VRAM
  • Collaboration et soutien de chercheurs de Stability AI et de LAION

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.