Gemini 3 pour les développeurs : nouvelles capacités de raisonnement et d’agent

(blog.google)

5 points par GN⁺ 2025-11-19 | 2 commentaires | Partager sur WhatsApp

Gemini 3 Pro est le dernier modèle d’IA présenté par Google, offrant des capacités de raisonnement et des performances en codage améliorées par rapport à la version précédente
Il prend en charge un environnement de développement orienté agents et peut être utilisé sur diverses plateformes comme Google AI Studio, Vertex AI et Antigravity
Grâce à la fonctionnalité de « vibe coding », qui permet de créer des applications en langage naturel, il est possible de produire une application complète à partir d’un seul prompt
Les performances en compréhension multimodale, raisonnement visuel, spatial et vidéo ont été renforcées, élargissant les usages pour les images complexes, la vidéo et les tâches liées aux interfaces utilisateur
Intégré à l’ensemble du workflow des développeurs, il s’impose comme un nouveau standard du développement logiciel piloté par l’IA

Présentation de Gemini 3 Pro

Gemini 3 Pro est le modèle le plus intelligent de Google, surpassant la version précédente sur les principaux benchmarks IA
- Par rapport à 2.5 Pro, il améliore les performances en codage et la capacité à traiter des tâches zero-shot
Il s’intègre naturellement aux workflows orientés agents et aux environnements de codage existants, ouvrant la voie à de nouveaux cas d’usage
La tarification est de 2 dollars par million de tokens en entrée et de 12 dollars par million de tokens en sortie (pour des prompts de 200k tokens ou moins)
Une version preview est disponible via Google AI Studio et Vertex AI, avec certaines fonctionnalités proposées gratuitement

Codage orienté agents (Agentic Coding)

Gemini 3 Pro a obtenu un score de 54,2 % sur Terminal-Bench 2.0, démontrant sa capacité à utiliser des outils basés sur le terminal
Il est intégré à Google Antigravity, Gemini CLI, Android Studio, Cursor, GitHub, JetBrains, Manus et Cline
- Cline exploite Gemini 3 pour proposer une fonction de génération autonome de code dans l’IDE
Le modèle renforce aussi sa capacité à conserver le contexte sur des tâches de code de longue durée, comme le refactoring multifichier, le débogage et l’implémentation de fonctionnalités

Plateforme Google Antigravity

Google Antigravity est une plateforme de développement orientée agents fondée sur Gemini 3, où les développeurs peuvent gérer plusieurs agents pour accomplir leur travail
- Elle fournit un environnement collaboratif d’agents intelligents opérant de manière autonome dans l’éditeur, le terminal et le navigateur
Le développeur prend le rôle de concepteur, tandis que les agents se chargent de l’implémentation des fonctionnalités, des itérations UI, de la correction de bugs, de la recherche et de la génération de rapports
Une preview publique téléchargeable gratuitement est disponible pour macOS, Windows et Linux

API Gemini

Grâce à l’outil bash côté client, le modèle peut suggérer des commandes shell et automatiser des tâches système
L’outil bash côté serveur prend en charge la génération de code dans plusieurs langages ainsi que le prototypage sécurisé
Il est possible de combiner l’ancrage aux données basé sur Google Search (Grounding) et la fonctionnalité URL context avec des sorties structurées
- Après collecte et extraction des données, celles-ci peuvent être utilisées dans des tâches d’agent en aval

Vibe coding

Gemini 3 Pro propose une fonctionnalité de vibe coding qui permet de créer des applications uniquement en langage naturel
- Grâce à une meilleure compréhension d’instructions complexes et à une meilleure utilisation des outils, il peut générer une application interactive complète à partir d’un seul prompt
Il a obtenu un score de 1487 Elo sur le classement WebDev Arena
Les performances ont été renforcées dans les workflows UI/frontend de la plateforme de développement d’applications full-stack d’Emergent
Dans Google AI Studio, il est possible de créer des jeux ou des applications à partir de notes vocales ou d’esquisses
- Le Build mode connecte automatiquement le modèle et l’API afin d’ajouter rapidement des fonctionnalités IA

Compréhension multimodale (Multimodal Understanding)

Gemini 3 a atteint les meilleures performances sur MMMU-Pro et Video MMMU
- Il établit une nouvelle référence pour le raisonnement sur des images et vidéos complexes
Sa fenêtre de contexte d’un million de tokens améliore l’efficacité du développement d’applications multimodales
Il est possible d’ajuster finement la résolution de traitement visuel (media resolution) afin de contrôler la latence et les coûts

Raisonnement visuel (Visual Reasoning)

Il va au-delà de l’OCR simple pour effectuer de la compréhension et du raisonnement sur des documents
Une application de démonstration permet de transformer de simples entrées d’image en expériences web interactives

Raisonnement spatial (Spatial Reasoning)

Les capacités de compréhension spatiale ont été renforcées pour le pointage, la prédiction de trajectoire et le suivi de progression des tâches
- Elles peuvent être exploitées dans la conduite autonome, la XR ou encore la robotique
Les fonctions de compréhension de l’écran et de reconnaissance du comportement utilisateur améliorent les performances dans les environnements desktop et mobile
- Le modèle déduit l’intention de l’utilisateur à partir des mouvements de souris et des annotations

Raisonnement vidéo (Video Reasoning)

La compréhension à haute fréquence d’images permet de capter des détails même dans des scènes rapides
Grâce à une mémoire de contexte longue durée, il peut structurer une narration et extraire des détails à partir de vidéos de plusieurs heures
Dans l’environnement Agent Opus, la vitesse a progressé de 32 %, avec une amélioration de la précision et de la fiabilité dans l’exécution de commandes complexes

Intégration et usages pour les développeurs

L’intégration dans les applications est immédiatement possible via l’API Gemini
- De nouveaux paramètres thinking level, media resolution et thought signatures ont été ajoutés
Une architecture orientée agents est prise en charge dans Gemini CLI, l’application Android et Google Antigravity
Le Build mode de Google AI Studio permet de générer une application à partir d’un seul prompt
- La fonctionnalité I’m feeling lucky automatise l’implémentation de code créatif

Conclusion

Gemini 3 Pro marque un tournant pour les environnements de développement centrés sur l’IA, en s’intégrant aux workflows existants tout en proposant de nouvelles méthodes de développement
Google fournit aux développeurs des outils qui repoussent les limites de ce qu’il est possible de faire avec l’IA
Cela annonce le début de l’ère Gemini 3, avec l’espoir que les développeurs s’en servent pour créer de nouvelles innovations

2 commentaires

iolothebard 2025-11-26

Avec la fonctionnalité vibe coding intégrée !! mdr

GN⁺ 2025-11-19

Discussion sur Hacker News

Les commentaires ont été fusionnés avec Gemini 3 - Présentation des derniers modèles d’IA Gemini de Google

Gemini 3 pour les développeurs : nouvelles capacités de raisonnement et d’agent

Présentation de Gemini 3 Pro

Codage orienté agents (Agentic Coding)

Plateforme Google Antigravity

API Gemini

Vibe coding

Compréhension multimodale (Multimodal Understanding)

Raisonnement visuel (Visual Reasoning)

Raisonnement spatial (Spatial Reasoning)

Raisonnement vidéo (Video Reasoning)

Intégration et usages pour les développeurs

Conclusion

À lire aussi

2 commentaires

Discussion sur Hacker News