- La fonction de génération d’images de ChatGPT a été mise à niveau pour offrir des retouches plus précises et une génération plus rapide
- Le modèle GPT‑Image‑1.5 suit plus fidèlement les instructions textuelles et permet des modifications tout en préservant la ressemblance, l’éclairage et la composition des personnes
- La nouvelle interface latérale Images prend en charge les styles prédéfinis, les prompts tendance et la réutilisation de l’apparence
- Dans l’API aussi, les mêmes gains de performance s’accompagnent d’une baisse des coûts de 20 %, ce qui convient à la génération de logos de marque et d’images produit
- Cette mise à jour est déployée immédiatement pour tous les utilisateurs de ChatGPT et de l’API et améliore fortement l’utilité pratique et la qualité de la génération d’images
Présentation de GPT‑Image‑1.5
- Publication d’une nouvelle version de ChatGPT Images basée sur le modèle de génération d’images le plus puissant
- Il suit plus précisément les instructions textuelles et permet de modifier des images tout en conservant des détails comme la ressemblance du visage
- La vitesse de génération d’images est jusqu’à 4 fois plus rapide, ce qui améliore l’efficacité des itérations et de l’exploration d’idées
- Le modèle offre des transformations expressives, un rendu de texte dense et des résultats naturels
- Il prend en charge aussi bien de petites retouches que des reconstructions complètes, avec la possibilité de choisir des styles prédéfinis pour créer plus simplement
- Le déploiement progressif est en cours pour tous les utilisateurs de ChatGPT, et il est proposé dans l’API sous le nom GPT‑Image‑1.5
Des résultats alignés sur l’intention de l’utilisateur
- Le modèle ne modifie que les parties demandées tout en conservant de manière cohérente l’éclairage, la composition et la ressemblance de la personne
- Cela permet d’obtenir une forte correspondance dans des cas comme la retouche photo, la simulation de vêtements ou de coiffures, les filtres de style et les transformations conceptuelles
- ChatGPT peut ainsi servir de studio créatif portable, capable à la fois de retouches pratiques et de reconstructions artistiques
- Prise en charge de divers types d’édition (ajout, suppression, combinaison, mélange, etc.)
- Renforcement des fonctions de transformation créative pour ajouter des éléments comme du texte ou de la mise en page
- Meilleure compréhension des consignes par rapport à GPT Image 1.0, permettant des retouches plus fines
- Amélioration de la qualité du rendu de texte dense et de petite taille
Un nouvel espace de génération d’images
- Introduction dans ChatGPT d’une barre latérale dédiée à Images pour raccourcir l’exploration et la création d’images
- Comprend des filtres prédéfinis, des prompts tendance et une fonction de réutilisation de l’apparence
- Une seule image téléversée peut être réutilisée à plusieurs reprises, sans avoir à repasser par la galerie photo
- La vitesse de génération d’images est jusqu’à 4 fois supérieure, avec la possibilité de créer plusieurs images en même temps
- Des petites retouches aux reconstructions complètes, les résultats correspondent à la vision de l’utilisateur
Améliorations supplémentaires de la qualité
- Améliorations immédiatement utiles, comme la représentation de nombreux petits visages et le rendu naturel des résultats
- Exemple : reconstitution réaliste d’une scène de rue londonienne des années 1970, avec un meilleur focus sur les détails et la représentation des personnages
Améliorations et limites
- Une amélioration nette des performances a été confirmée dans divers cas par rapport à la version initiale
- Certains résultats restent toutefois imparfaits, et des aspects comme la gestion de plusieurs visages et le multilingue peuvent encore progresser
Disponibilité de GPT Image 1.5 via l’API
- La version API inclut les mêmes améliorations que ChatGPT Images
- Préservation de la cohérence des logos de marque et des visuels clés
- Adapté à la génération d’images pour le marketing et le e-commerce
- Les coûts d’entrée et de sortie baissent de 20 %, permettant de générer davantage d’images à budget identique
- Disponible à l’essai dans OpenAI Playground, la galerie et le guide de prompts
- Des entreprises comme Wix, Canva, Figma et Envato l’utilisent déjà
- Wix estime qu’il permet de prendre en charge des workflows de production rapides grâce à une génération d’images de haute qualité et très cohérente
Lancement et déploiement
- Le nouveau modèle ChatGPT Images est déployé immédiatement pour tous les utilisateurs de ChatGPT et de l’API dans le monde
- Il peut être utilisé sans sélection de modèle distincte, tandis que la version précédente est maintenue sous forme de GPT personnalisé
- OpenAI considère cette mise à jour comme une étape importante dans l’évolution des technologies de génération d’images
- D’autres améliorations sont prévues, notamment des retouches plus fines et une meilleure prise en charge du multilingue
Aucun commentaire pour le moment.