10 points par GN⁺ 2026-02-27 | 1 commentaires | Partager sur WhatsApp
  • Combine les fonctionnalités avancées de Nano Banana Pro et la vitesse de Gemini Flash, permettant une génération d’images rapide et des itérations d’édition
  • Offre à grande vitesse des fonctionnalités de niveau professionnel comme le rendu fondé sur la connaissance du monde, la restitution et la traduction précises du texte, le maintien de la cohérence des sujets et la prise en charge de la résolution 4K
  • Déploiement dans l’ensemble des applications Google : application Gemini, Search, AI Studio et Gemini API, Flow, Google Ads, etc.
  • Renforce les fonctions d’identification et de vérification de la provenance des contenus générés par l’IA en combinant SynthID et les C2PA Content Credentials
  • Avec Nano Banana 2, Google évolue dans une direction qui améliore à la fois la fiabilité et l’utilité des médias génératifs

Présentation de Nano Banana 2

  • Nano Banana 2 (Gemini 3.1 Flash Image), dévoilé par Google DeepMind, est un modèle qui combine les fonctions avancées de Nano Banana Pro avec la vitesse de Gemini Flash
    • Le modèle précédent, Nano Banana, avait attiré l’attention en redéfinissant l’approche de la génération et de l’édition d’images, tandis que Nano Banana Pro offrait des capacités de contrôle de niveau studio
    • Cette version réunit les atouts des deux modèles pour offrir à la fois une génération d’images de haute qualité et une grande rapidité de traitement
  • Nano Banana 2 se distingue par sa connaissance avancée du monde, son rendu précis du texte, sa cohérence des sujets et sa prise en charge des spécifications de production

Intelligence et qualité visuelle à la vitesse de Flash

  • Nano Banana 2 applique l’intelligence à haute vitesse de Gemini Flash à la génération visuelle afin de prendre en charge des éditions rapides et des cycles d’itération
    • Connaissance avancée du monde : grâce aux informations en temps réel de Gemini et aux données issues d’images du web, il représente plus précisément des sujets spécifiques
    • Cela permet de créer des infographies, diagrammes et visualisations de données
  • Grâce à un rendu précis du texte et à des fonctions de traduction, il peut générer un texte net pour des maquettes marketing ou des cartes, et traduire/localiser le texte présent dans une image

Capacités de contrôle créatif améliorées

  • Nano Banana 2 réduit l’écart entre vitesse et fidélité visuelle pour générer rapidement des images réalistes et de haute qualité
    • Cohérence des sujets : maintien cohérent de jusqu’à 5 personnages et 14 objets au sein d’un même workflow
    • Exécution précise des consignes : restitution fidèle des nuances détaillées de demandes complexes
    • Spécifications de production : prise en charge de résolutions de 512 px à 4K et de divers formats, des publications sociales aux arrière-plans panoramiques
    • Amélioration de la fidélité visuelle : textures, éclairages et détails plus riches

Intégration produit et accessibilité

  • Nano Banana 2 est en cours de déploiement progressif dans l’ensemble de Google
    • Application Gemini : Nano Banana 2 est intégré par défaut aux modèles Fast, Thinking et Pro, tandis que les abonnés Pro et Ultra peuvent également conserver le modèle Pro
    • Search : disponible sur mobile et desktop via le mode IA et Lens, avec une prise en charge supplémentaire dans 141 pays et 8 langues
    • AI Studio et Gemini API : proposés en version preview, également disponibles dans Vertex AI
    • Flow : défini comme modèle de génération d’images par défaut, accessible gratuitement à tous les utilisateurs
    • Google Ads : utilisé pour la fonction de suggestion d’images lors de la création de campagnes publicitaires

Vérification de la provenance et renforcement de la fiabilité

  • Google combine SynthID et les C2PA Content Credentials pour accroître la fiabilité des médias génératifs
    • Cette combinaison fournit non seulement l’information sur l’usage de l’IA, mais aussi des informations contextuelles sur la manière dont elle a été utilisée
    • Depuis son lancement, la fonction de vérification SynthID a été utilisée plus de 20 millions de fois pour identifier des images, vidéos et audios générés par l’IA
    • La fonction de vérification C2PA sera bientôt ajoutée à l’application Gemini

Résumé

  • Nano Banana 2 est le dernier modèle de génération d’images de Google, réunissant vitesse, précision et qualité
  • Intégré à l’ensemble de l’écosystème Gemini, il offre un potentiel d’usage immédiat aux développeurs, designers et spécialistes marketing
  • Un exemple d’évolution stratégique de Google, qui cherche à la fois à garantir la transparence des contenus IA et à améliorer la productivité créative

1 commentaires

 
GN⁺ 2026-02-27
Avis sur Hacker News
  • Quelques prédictions sur l’impact que les outils de génération d’images par IA auront sur l’art

    1. À l’avenir, le récit et la vie de l’artiste deviendront bien plus importants. Il ne suffira plus de produire des œuvres, il faudra aussi construire sa propre histoire et son propre univers
    2. La valeur de l’originalité va augmenter. L’IA ne peut que mélanger l’existant et, n’ayant pas d’expérience vécue, elle ne peut pas créer de véritable nouveauté
    3. Les personnes qui apprennent de vraies techniques artistiques prendront une large avance sur celles qui se contentent d’écrire des prompts. Ceux qui font des efforts se distingueront de plus en plus
    4. Au final, c’est le « goût » qui restera le facteur le plus important. La plupart de l’art IA n’est pas bon, et ce n’est pas un problème technique mais un problème de sensibilité
    5. L’art réalisé avec des matériaux physiques, comme la sculpture ou les installations difficiles à numériser, gagnera en popularité. L’art IA aura du mal à devenir mainstream parce qu’il n’est « pas cool »
    • Je ne suis pas d’accord avec la plupart de ces arguments. Par exemple, les humains aussi finissent par copier et recombiner l’existant. L’« originalité » n’a rien d’un pouvoir divin
      Avec les progrès de la technologie, même le « goût » pourrait finir par être résolu techniquement. Si l’IA n’est « pas cool » aujourd’hui, c’est peut-être simplement une question de maturité
      Comme avec SpaceX, rabaisser l’ensemble sur la base d’objectifs pas encore atteints est une mauvaise critique
    • Nous avons déjà traversé 50 ans de postmodernisme, donc je vois mal en quoi le récit de l’artiste pourrait devenir plus important
      À la place, je pense que l’« emergent design » sera la prochaine tendance. Par exemple, Czinger montre une approche où la forme émerge via l’optimisation probabiliste
    • Je pense que le message transmis par une œuvre est plus important que la vie de l’artiste.
      Par exemple, même si Sora produisait une vidéo de football parfaite, les fans regarderaient quand même un vrai match. Si nous apprécions l’art, c’est à cause de ce lien émotionnel avec quelque chose créé par un humain
      Donc j’aimerais poser cette question à ceux qui disent que « l’art IA est cool » — « alors, à quoi sert l’art ? »
    • À l’avenir, l’information indiquant qu’une œuvre a été produite par une IA ou par un humain deviendra en soi essentielle. Dans un contexte commercial, cette distinction a de fortes chances d’être encadrée juridiquement
    • Je pense que l’essence de l’art, ce n’est pas le médium mais l’idée. Des outils faciles ne garantissent pas de bons résultats
      J’ai vu beaucoup d’œuvres impressionnantes créées par de vrais artistes avec l’IA, et j’ai hâte de voir quelles tentatives créatives sortiront de cet outil
  • Je suis en train de construire une maison, et le modèle d’image de Nano Banana a complètement changé la donne dans le processus de conception
    J’ai lancé des centaines de rendus pour trouver un design qui me plaisait, puis je l’ai intégré au travail de l’architecte d’intérieur
    Avec la CAO, il est difficile d’exprimer des courbes ou des éléments décoratifs, mais Nano Banana produit très bien des designs organiques
    Au final, la maison est en train d’être bien plus réussie visuellement

    • Le cœur du design d’intérieur, c’est au fond de transformer une image en réalité. Je serais curieux de savoir comment les rendus de Nano Banana sont convertis en matériaux réels, finitions et codes couleur
    • Je me demande si c’est une force propre à Nano Banana, ou si c’est aussi possible avec d’autres modèles comme Klein ou ZIT
    • NB Pro est impressionnant pour l’édition d’intérieur. Par exemple, si on remplace une fenêtre par un miroir, il reproduit correctement les reflets dans la pièce. Ce n’est pas parfait, mais c’est tout de même surprenant
      On peut voir un exemple dans ce blog
    • J’ai eu une expérience similaire. J’ai utilisé Gemini pour repenser mon jardin arrière, et c’était presque parfait, des recommandations de matériaux jusqu’à l’agencement.
      À part quelques idées originales proposées par le designer, Gemini était meilleur sur la plupart des points
    • J’ai moi-même créé une appli de visualisation d’intérieur, et les capacités de ces modèles sont encore sous-estimées par le grand public
      Le fait de pouvoir changer les couleurs, les meubles et la disposition en quelques secondes reste bluffant
  • En ce moment, les images IA sont tellement réalistes que beaucoup de gens ordinaires les prennent pour de vraies photos
    Par exemple, des photos de nourriture sur Facebook ou de fausses images de mannequins.
    Le pouvoir d’expression s’est amélioré, mais cela donne aussi un côté inquiétant

    • En pratique, presque tout le monde sur internet a déjà vu une image IA en croyant qu’elle était réelle
      Dans certains cas c’est évident, mais la plupart du temps il est impossible de faire la différence
    • Je pense au contraire que c’est une bonne chose. Avant, la retouche d’image coûtait si cher que la plupart des gens pensaient qu’une photo était « vraie »
      Maintenant que tout le monde peut créer de fausses images, les gens vont naturellement apprendre à vérifier les sources et à juger de la fiabilité
    • Bientôt, même les vrais modèles OnlyFans pourraient perdre leur travail. On pourra générer par prompt des contenus adaptés aux goûts de chacun
    • Malgré cela, la demande pour du contenu avec de vraies personnes ne disparaîtra pas
    • Si une vidéo manipulée avec mon visage commençait à circuler, je pense qu’au contraire je diffuserais moi-même des deepfakes pour noyer la vraie
  • À long terme, les images vont devenir des commodités et perdre leur valeur émotionnelle
    Autrefois, une photo était précieuse, alors qu’aujourd’hui ce n’est qu’une image parmi des milliers.
    L’art IA suivra la même trajectoire : s’il y en a trop, l’émotion s’émousse

    • C’est pour cela que j’ai l’impression qu’on assiste à un retour des médias analogiques.
      Je fais de la photo de mariage, et depuis deux ans les demandes de prises de vue sur pellicule explosent.
      La popularité des vinyles ou des vieux appareils photo numériques relève du même phénomène
    • Mais je pense que si l’on sélectionne et rassemble de bonnes photos, la profondeur émotionnelle peut rester intacte
    • Nous vivons une époque où le changement va trop vite. En tant que spectateur, c’est fascinant, mais pour ceux qui se lancent eux-mêmes, c’est aussi une période effrayante
    • Comme avec Star Wars, quand il y a surabondance de contenu, l’émotion se dilue. Des scènes autrefois iconiques paraissent maintenant ordinaires
    • Dans mon cas, comme l’IA trie automatiquement les photos, j’ai au final l’impression que le nombre de bonnes photos reste à peu près le même qu’avant
  • L’exemple de cubisme dans la présentation du nouveau modèle est un peu décevant
    Le cœur du cubisme, c’était de faire coexister plusieurs points de vue, plusieurs temporalités et plusieurs styles dans une même image,
    alors que l’IA se contente d’imiter une simple fragmentation géométrique. On a toujours l’impression qu’elle copie davantage la « forme » que le « sens »

    • J’ai ressenti la même chose, mais cette démo visait sans doute davantage à montrer la précision des structures physiques qu’un style artistique
      Avant, elle produisait des bâtiments aléatoires, alors que maintenant elle recherche et utilise de vraies références
      On peut voir plus de détails sur la page DeepMind Gemini Image Flash
  • Si une telle IA avait existé dans le passé, des œuvres comme La Joconde ou le plafond de la chapelle Sixtine n’auraient peut-être jamais vu le jour
    Puisqu’on aurait pu les obtenir à moindre coût avec un prompt

    • Je pense plutôt l’inverse. Un artiste ne crée pas pour l’argent, mais par désir de dépasser les limites.
      L’IA est un outil qui élèvera encore plus ces limites
    • Si de tels modèles existent aujourd’hui, c’est grâce au grand art du passé
    • Pour moi, l’IA est à terme incompatible avec le capitalisme.
      À mesure que la technologie progresse, la « rareté » disparaît, et la vraie valeur se concentrera dans les systèmes de contrôle
      Les maîtres du passé sont restés dans les mémoires grâce à leurs mécènes, alors qu’aujourd’hui les créateurs sont invisibilisés par la nécessité de gagner leur vie
      Comme le disait Terence McKenna, l’avenir ira dans une direction de plus en plus étrange et contradictoire
      Voir à ce sujet ce lien
    • Si on avait peint la Joconde avec Illustrator en 2015, est-ce que cela aurait été mieux ? C’est la question que j’aimerais poser
    • L’IA ne peut au fond que combiner des concepts existants.
      Par exemple, elle peut produire « Jésus plantant un drapeau sur la Lune », mais « jacquesm plantant un drapeau sur la Lune » donne n’importe quoi
  • J’ai testé les résultats de gemini-3.1-flash-image-preview (NB 2) dans GenAI Showdown
    L’amélioration entre NB et NB Pro était importante, mais entre NB Pro et NB Pro 2, il n’y avait pas de grand saut
    En particulier, la qualité de l’édition locale (localization) a même baissé
    Voir ce lien pour la comparaison détaillée

    • Bon test, mais les appellations sont NB Pro et NB 2, pas NB Pro 2
    • J’aime vraiment beaucoup votre site et votre travail
  • J’ai brièvement essayé NB Pro 2, et cela ressemble davantage à une amélioration progressive qu’à un bond fonctionnel
    Cela dit, le fait qu’il passe le « King Louie jump rope test » était impressionnant
    Les résultats du test sont visibles sur cette page

  • Pour l’édition de photos personnelles, les restrictions de détection de célébrités restent beaucoup trop fortes
    Presque tous les visages sont reconnus comme des « sosies de célébrités », ce qui empêche l’édition

    • Ces restrictions n’existent qu’en Europe. Avec un VPN américain ou Vertex AI, on peut générer des personnes librement
  • D’un point de vue ingénierie, c’est une technologie impressionnante, mais je me demande s’il existe une justification commerciale légitime pour son usage
    On dirait surtout que les gens s’en servent parce qu’ils ne veulent pas payer des artistes
    Quand de grandes entreprises diffusent du contenu à très grande échelle, l’impact négatif peut même être plus important

    • Comme les photocopieuses ou l’e-mail, la technologie a toujours servi à réduire les coûts et remplacer des tâches. Cette fois-ci ne fait pas exception
    • Dans la publicité, c’est particulièrement utile pour les petites entreprises avec peu de budget
    • C’est utile pour créer des diagrammes. Si les documents manquent souvent de visuels, c’est parce qu’ils sont difficiles à produire
    • Moi aussi, dans mes projets personnels, j’utilise NB à la place de Photoshop, et un travail qui me prenait une heure se termine en 3 minutes
      Ce gain d’efficacité est tout à fait applicable aux petites entreprises
    • Je ne suis pas d’accord avec l’idée que tout le monde devrait accepter l’inefficacité pour préserver les moyens de subsistance des artistes