NVIDIA présente « Perfusion », un modèle de génération d’images personnalisées de 100 kB
(research.nvidia.com)NVIDIA a récemment dévoilé « Perfusion », un modèle permettant de générer des images personnalisées, via l’article « Key_Locked Rank One Editing for Text-to-Image Personalization », accepté à SIGGRAPH 2023, avec environ 4 minutes d’entraînement pour une taille de modèle de 100 kB.
Il ne s’agit pas de créer l’image entière à partir de pur texte, mais d’entrer quelques images d’exemple pour définir un concept, puis un texte incluant ce concept, afin de générer une image correspondante.
Les résultats présentés sur la page de présentation et dans l’article sont impressionnants.
Le code devrait être publié prochainement.
1 commentaires
Ce n'est quand même pas 4 minutes sur une A100, hein..?