- Combine les fonctionnalités avancées de Nano Banana Pro et la vitesse de Gemini Flash, permettant une génération d’images rapide et des itérations d’édition
- Offre à grande vitesse des fonctionnalités de niveau professionnel comme le rendu fondé sur la connaissance du monde, la restitution et la traduction précises du texte, le maintien de la cohérence des sujets et la prise en charge de la résolution 4K
- Déploiement dans l’ensemble des applications Google : application Gemini, Search, AI Studio et Gemini API, Flow, Google Ads, etc.
- Renforce les fonctions d’identification et de vérification de la provenance des contenus générés par l’IA en combinant SynthID et les C2PA Content Credentials
- Avec Nano Banana 2, Google évolue dans une direction qui améliore à la fois la fiabilité et l’utilité des médias génératifs
Présentation de Nano Banana 2
- Nano Banana 2 (Gemini 3.1 Flash Image), dévoilé par Google DeepMind, est un modèle qui combine les fonctions avancées de Nano Banana Pro avec la vitesse de Gemini Flash
- Le modèle précédent, Nano Banana, avait attiré l’attention en redéfinissant l’approche de la génération et de l’édition d’images, tandis que Nano Banana Pro offrait des capacités de contrôle de niveau studio
- Cette version réunit les atouts des deux modèles pour offrir à la fois une génération d’images de haute qualité et une grande rapidité de traitement
- Nano Banana 2 se distingue par sa connaissance avancée du monde, son rendu précis du texte, sa cohérence des sujets et sa prise en charge des spécifications de production
Intelligence et qualité visuelle à la vitesse de Flash
- Nano Banana 2 applique l’intelligence à haute vitesse de Gemini Flash à la génération visuelle afin de prendre en charge des éditions rapides et des cycles d’itération
- Connaissance avancée du monde : grâce aux informations en temps réel de Gemini et aux données issues d’images du web, il représente plus précisément des sujets spécifiques
- Cela permet de créer des infographies, diagrammes et visualisations de données
- Grâce à un rendu précis du texte et à des fonctions de traduction, il peut générer un texte net pour des maquettes marketing ou des cartes, et traduire/localiser le texte présent dans une image
Capacités de contrôle créatif améliorées
- Nano Banana 2 réduit l’écart entre vitesse et fidélité visuelle pour générer rapidement des images réalistes et de haute qualité
- Cohérence des sujets : maintien cohérent de jusqu’à 5 personnages et 14 objets au sein d’un même workflow
- Exécution précise des consignes : restitution fidèle des nuances détaillées de demandes complexes
- Spécifications de production : prise en charge de résolutions de 512 px à 4K et de divers formats, des publications sociales aux arrière-plans panoramiques
- Amélioration de la fidélité visuelle : textures, éclairages et détails plus riches
Intégration produit et accessibilité
- Nano Banana 2 est en cours de déploiement progressif dans l’ensemble de Google
- Application Gemini : Nano Banana 2 est intégré par défaut aux modèles Fast, Thinking et Pro, tandis que les abonnés Pro et Ultra peuvent également conserver le modèle Pro
- Search : disponible sur mobile et desktop via le mode IA et Lens, avec une prise en charge supplémentaire dans 141 pays et 8 langues
- AI Studio et Gemini API : proposés en version preview, également disponibles dans Vertex AI
- Flow : défini comme modèle de génération d’images par défaut, accessible gratuitement à tous les utilisateurs
- Google Ads : utilisé pour la fonction de suggestion d’images lors de la création de campagnes publicitaires
Vérification de la provenance et renforcement de la fiabilité
- Google combine SynthID et les C2PA Content Credentials pour accroître la fiabilité des médias génératifs
- Cette combinaison fournit non seulement l’information sur l’usage de l’IA, mais aussi des informations contextuelles sur la manière dont elle a été utilisée
- Depuis son lancement, la fonction de vérification SynthID a été utilisée plus de 20 millions de fois pour identifier des images, vidéos et audios générés par l’IA
- La fonction de vérification C2PA sera bientôt ajoutée à l’application Gemini
Résumé
- Nano Banana 2 est le dernier modèle de génération d’images de Google, réunissant vitesse, précision et qualité
- Intégré à l’ensemble de l’écosystème Gemini, il offre un potentiel d’usage immédiat aux développeurs, designers et spécialistes marketing
- Un exemple d’évolution stratégique de Google, qui cherche à la fois à garantir la transparence des contenus IA et à améliorer la productivité créative
1 commentaires
Avis sur Hacker News
Quelques prédictions sur l’impact que les outils de génération d’images par IA auront sur l’art
Avec les progrès de la technologie, même le « goût » pourrait finir par être résolu techniquement. Si l’IA n’est « pas cool » aujourd’hui, c’est peut-être simplement une question de maturité
Comme avec SpaceX, rabaisser l’ensemble sur la base d’objectifs pas encore atteints est une mauvaise critique
À la place, je pense que l’« emergent design » sera la prochaine tendance. Par exemple, Czinger montre une approche où la forme émerge via l’optimisation probabiliste
Par exemple, même si Sora produisait une vidéo de football parfaite, les fans regarderaient quand même un vrai match. Si nous apprécions l’art, c’est à cause de ce lien émotionnel avec quelque chose créé par un humain
Donc j’aimerais poser cette question à ceux qui disent que « l’art IA est cool » — « alors, à quoi sert l’art ? »
J’ai vu beaucoup d’œuvres impressionnantes créées par de vrais artistes avec l’IA, et j’ai hâte de voir quelles tentatives créatives sortiront de cet outil
Je suis en train de construire une maison, et le modèle d’image de Nano Banana a complètement changé la donne dans le processus de conception
J’ai lancé des centaines de rendus pour trouver un design qui me plaisait, puis je l’ai intégré au travail de l’architecte d’intérieur
Avec la CAO, il est difficile d’exprimer des courbes ou des éléments décoratifs, mais Nano Banana produit très bien des designs organiques
Au final, la maison est en train d’être bien plus réussie visuellement
On peut voir un exemple dans ce blog
À part quelques idées originales proposées par le designer, Gemini était meilleur sur la plupart des points
Le fait de pouvoir changer les couleurs, les meubles et la disposition en quelques secondes reste bluffant
En ce moment, les images IA sont tellement réalistes que beaucoup de gens ordinaires les prennent pour de vraies photos
Par exemple, des photos de nourriture sur Facebook ou de fausses images de mannequins.
Le pouvoir d’expression s’est amélioré, mais cela donne aussi un côté inquiétant
Dans certains cas c’est évident, mais la plupart du temps il est impossible de faire la différence
Maintenant que tout le monde peut créer de fausses images, les gens vont naturellement apprendre à vérifier les sources et à juger de la fiabilité
À long terme, les images vont devenir des commodités et perdre leur valeur émotionnelle
Autrefois, une photo était précieuse, alors qu’aujourd’hui ce n’est qu’une image parmi des milliers.
L’art IA suivra la même trajectoire : s’il y en a trop, l’émotion s’émousse
Je fais de la photo de mariage, et depuis deux ans les demandes de prises de vue sur pellicule explosent.
La popularité des vinyles ou des vieux appareils photo numériques relève du même phénomène
L’exemple de cubisme dans la présentation du nouveau modèle est un peu décevant
Le cœur du cubisme, c’était de faire coexister plusieurs points de vue, plusieurs temporalités et plusieurs styles dans une même image,
alors que l’IA se contente d’imiter une simple fragmentation géométrique. On a toujours l’impression qu’elle copie davantage la « forme » que le « sens »
Avant, elle produisait des bâtiments aléatoires, alors que maintenant elle recherche et utilise de vraies références
On peut voir plus de détails sur la page DeepMind Gemini Image Flash
Si une telle IA avait existé dans le passé, des œuvres comme La Joconde ou le plafond de la chapelle Sixtine n’auraient peut-être jamais vu le jour
Puisqu’on aurait pu les obtenir à moindre coût avec un prompt
L’IA est un outil qui élèvera encore plus ces limites
À mesure que la technologie progresse, la « rareté » disparaît, et la vraie valeur se concentrera dans les systèmes de contrôle
Les maîtres du passé sont restés dans les mémoires grâce à leurs mécènes, alors qu’aujourd’hui les créateurs sont invisibilisés par la nécessité de gagner leur vie
Comme le disait Terence McKenna, l’avenir ira dans une direction de plus en plus étrange et contradictoire
Voir à ce sujet ce lien
Par exemple, elle peut produire « Jésus plantant un drapeau sur la Lune », mais « jacquesm plantant un drapeau sur la Lune » donne n’importe quoi
J’ai testé les résultats de
gemini-3.1-flash-image-preview(NB 2) dans GenAI ShowdownL’amélioration entre NB et NB Pro était importante, mais entre NB Pro et NB Pro 2, il n’y avait pas de grand saut
En particulier, la qualité de l’édition locale (localization) a même baissé
Voir ce lien pour la comparaison détaillée
J’ai brièvement essayé NB Pro 2, et cela ressemble davantage à une amélioration progressive qu’à un bond fonctionnel
Cela dit, le fait qu’il passe le « King Louie jump rope test » était impressionnant
Les résultats du test sont visibles sur cette page
Pour l’édition de photos personnelles, les restrictions de détection de célébrités restent beaucoup trop fortes
Presque tous les visages sont reconnus comme des « sosies de célébrités », ce qui empêche l’édition
D’un point de vue ingénierie, c’est une technologie impressionnante, mais je me demande s’il existe une justification commerciale légitime pour son usage
On dirait surtout que les gens s’en servent parce qu’ils ne veulent pas payer des artistes
Quand de grandes entreprises diffusent du contenu à très grande échelle, l’impact négatif peut même être plus important
Ce gain d’efficacité est tout à fait applicable aux petites entreprises