- Le dernier modèle de génération d’images, Gemini 3 Pro Image (nom de code « Nano Banana Pro »), suscite à la fois enthousiasme et inquiétude dans le secteur de la visualisation architecturale
- Son principal élément différenciant par rapport aux outils d’IA existants est sa capacité à lire les plans (blueprint literacy), en interprétant les plans d’étage non comme des lignes abstraites, mais comme des instructions architecturales
- Midjourney est le « rêveur », DALL-E 3 le « communicant », et Nano Banana Pro l’« ingénieur » : les rôles se spécialisent
- Dans la communauté Reddit r/ArchViz, l’avis dominant est que l’IA est utile pour le concept art, mais n’atteint pas la précision requise pour des documents de construction
- Pour l’instant, il s’agit d’un outil d’idéation plutôt que d’un substitut à la documentation, et dans les 5 prochaines années, la maîtrise de l’IA pourrait devenir une compétence de base dans l’architecture, au même titre qu’AutoCAD ou Revit
Réactions de la communauté : enthousiasme vs. inquiétude
- Sur Reddit, les communautés r/GeminiAI et r/ArchViz discutent activement de Nano Banana Pro, partagent des workflows et posent aussi la question inconfortable : « Les artistes humains vont-ils devenir obsolètes ? »
- Un utilisateur de r/ArchViz a formulé un point de vue nuancé : l’IA est puissante, mais manque de la précision nécessaire pour les travaux professionnels à haut risque
- « Pour une validation en commission, une réunion avec des parties prenantes ou un dépôt auprès d’une collectivité, il faut représenter l’environnement avec exactitude, et ce niveau de détail et de contrôle est impossible avec l’IA »
- Les hallucinations de l’IA (lorsque le modèle génère des détails inexistants) sont acceptables en concept art, mais deviennent critiques dans des documents de construction
- Pour un designer d’intérieur qui doit spécifier le textile d’un fabricant précis ou le détail d’un assemblage, une IA qui « répond au feeling » reste insuffisante
Le point de vue des experts : la capacité à lire les plans
- L’architecte et défenseur de l’IA Ismail Seleit a partagé sur LinkedIn les résultats de ses expérimentations
- Il s’est dit très impressionné par la qualité graphique et surpris par la manière dont le modèle interprète les plans, bien qu’il ne soit pas basé sur des vecteurs
- Nano Banana Pro interprète les plans d’une manière qui génère non pas simplement de jolies images, mais une véritable idéation architecturale
- L’utilisateur X (Twitter) @ai_for_success a exprimé une réaction similaire
- « J’ai converti ce plan en image 3D réaliste, et il ne s’agit pas simplement de génération d’image : le modèle lit d’abord correctement le plan, puis produit un résultat final qui reflète tous les détails »
- Ce n’est pas seulement une IA qui « rêve », mais une IA capable de « lire » : c’est ce qui distingue cette génération d’outils
Expérimentation : test pratique
- Un test direct a été mené avec Nano Banana Pro, du concept brut jusqu’au rendu
- Formule de prompt recommandée par de nombreux utilisateurs : Subject + Action + Environment + Style + Lighting + Details
Étape 1 : le concept
- Demande faite à Gemini de générer un plan conceptuel textuel pour un musée
- 1er étage : lobby central en atrium, grand escalier, vaste hall d’exposition, café, boutique de souvenirs
- 2e étage : hall d’exposition secondaire, salles de classe, bureaux du personnel
- Extérieur : jardin avec cheminements organiques et sinueux
Étape 2 : passage en mode « ingénieur »
- Lorsqu’on lui demande une « vue de façade », le modèle montre des difficultés à maintenir la cohérence
- Après avoir téléversé le plan et demandé un rendu, Nano Banana Pro a répondu qu’il ne pouvait pas générer directement un fichier de rendu, mais qu’il pouvait jouer le rôle d’ingénieur prompt
- Cela montre que le « human in the loop » reste indispensable : l’IA convertit les données visuelles en prompt descriptif, mais a toujours besoin de guidage et de validation humaine
Étape 3 : exécution
- Le prompt final a été construit en combinant la formule de la communauté et les suggestions de l’« ingénieur prompt »
- Subject : musée d’art contemporain de deux étages avec toit plat et parement en calcaire
- Environment : jardin avec allées sinueuses et sculptures métalliques abstraites
- Style : rendu architectural photoréaliste, résolution 8K, grand angle cinématographique
- Lighting : golden hour, lumière artificielle chaude jaillissant des fenêtres
- Details : patine de la pierre, unités HVAC en toiture, silhouettes humaines pour l’échelle
Résultat
- Le résultat était « bon, mais pas parfait »
- Lorsqu’on demande d’autres angles ou des diagrammes architecturaux précis (comme une coupe isométrique), le modèle perd souvent le cap
- Il faut reformuler les prompts en continu pour maintenir la cohérence de l’emplacement du jardin de sculptures ou l’uniformité des meneaux de fenêtres
Nano Banana Pro vs. Midjourney vs. DALL-E
- Avec l’arrivée de Nano Banana Pro, les trois grands des visuels générés par IA semblent désormais occuper des rôles distincts
- Midjourney : le « rêveur » — excellent pour l’éclairage cinématographique, les détails artistiques et l’ambiance
- DALL-E 3 : le « communicant » — fort en facilité d’usage et en fidélité au prompt, mais moins convaincant en réalisme final
- Nano Banana Pro (Gemini) : l’« ingénieur » — il se taille une niche plus technique
- Son potentiel en visualisation réaliste et en édition fine est nettement supérieur
- Il reproduit des textures réelles, comme l’altération précise du calcaire ou des reflets de verre exacts, avec des résultats plus proches de la photo que de l’illustration
- La différence clé réside dans sa capacité à lire les plans (blueprint literacy)
- Midjourney traite les plans comme un ensemble de lignes abstraites et produit des interprétations « artistiques » souvent incohérentes sur le plan structurel
- Nano Banana Pro interprète ces lignes comme des instructions architecturales, ce qui lui permet de respecter la logique spatiale voulue
Conclusion : un outil d’inspiration, pas un remplaçant
- Pour l’instant, la position des designers reste sûre : Nano Banana Pro est excellent comme moteur d’idéation, mais ne remplace pas la documentation
- Dans les cinq prochaines années, la maîtrise de l’IA pourrait devenir une compétence standard dans les secteurs de l’architecture et de la construction, au même titre que la connaissance d’AutoCAD ou de Revit
- On pourrait évoluer vers des workflows hybrides : utiliser l’IA pour itérer sur la « mood » et l’« atmosphère » en phase amont, puis s’appuyer sur les logiciels BIM traditionnels pour la précision nécessaire à la construction réelle
- Une question importante n’était pas abordée dans cette expérimentation : le coût environnemental de l’entraînement des grands modèles et la consommation d’énergie de chaque génération
- Nano Banana Pro n’est ni un architecte ni un designer, mais un « miroir » : il reflète les idées avec plus de netteté et d’éclat, tout en nécessitant encore une main humaine pour le guider de façon fiable
Aucun commentaire pour le moment.