- Connecte ChatGPT à un Visual Foundation Model pour permettre l’envoi et la réception d’images pendant une conversation
- ChatGPT est entraîné sur le langage et ne peut donc pas traiter ni générer d’images
- Un VFM comprend et traite les images, mais ne peut gérer que des entrées et sorties ponctuelles
- En reliant les deux, il devient possible de générer des images, de modifier les images créées, ainsi que de supprimer ou modifier des objets spécifiques dans une image envoyée
- Possibilité d’envoyer des images avec du langage
- Collaboration entre modèles d’IA en plusieurs étapes via des questions visuelles complexes ou des commandes d’édition
- Retour utilisateur sur les résultats modifiés, etc.
1 commentaires
Une fois la machine lancée, les progrès se font vraiment à une vitesse folle.