5 points par GN⁺ 2025-11-19 | 2 commentaires | Partager sur WhatsApp
  • Gemini 3 Pro est le dernier modèle d’IA présenté par Google, offrant des capacités de raisonnement et des performances en codage améliorées par rapport à la version précédente
  • Il prend en charge un environnement de développement orienté agents et peut être utilisé sur diverses plateformes comme Google AI Studio, Vertex AI et Antigravity
  • Grâce à la fonctionnalité de « vibe coding », qui permet de créer des applications en langage naturel, il est possible de produire une application complète à partir d’un seul prompt
  • Les performances en compréhension multimodale, raisonnement visuel, spatial et vidéo ont été renforcées, élargissant les usages pour les images complexes, la vidéo et les tâches liées aux interfaces utilisateur
  • Intégré à l’ensemble du workflow des développeurs, il s’impose comme un nouveau standard du développement logiciel piloté par l’IA

Présentation de Gemini 3 Pro

  • Gemini 3 Pro est le modèle le plus intelligent de Google, surpassant la version précédente sur les principaux benchmarks IA
    • Par rapport à 2.5 Pro, il améliore les performances en codage et la capacité à traiter des tâches zero-shot
  • Il s’intègre naturellement aux workflows orientés agents et aux environnements de codage existants, ouvrant la voie à de nouveaux cas d’usage
  • La tarification est de 2 dollars par million de tokens en entrée et de 12 dollars par million de tokens en sortie (pour des prompts de 200k tokens ou moins)
  • Une version preview est disponible via Google AI Studio et Vertex AI, avec certaines fonctionnalités proposées gratuitement

Codage orienté agents (Agentic Coding)

  • Gemini 3 Pro a obtenu un score de 54,2 % sur Terminal-Bench 2.0, démontrant sa capacité à utiliser des outils basés sur le terminal
  • Il est intégré à Google Antigravity, Gemini CLI, Android Studio, Cursor, GitHub, JetBrains, Manus et Cline
    • Cline exploite Gemini 3 pour proposer une fonction de génération autonome de code dans l’IDE
  • Le modèle renforce aussi sa capacité à conserver le contexte sur des tâches de code de longue durée, comme le refactoring multifichier, le débogage et l’implémentation de fonctionnalités

Plateforme Google Antigravity

  • Google Antigravity est une plateforme de développement orientée agents fondée sur Gemini 3, où les développeurs peuvent gérer plusieurs agents pour accomplir leur travail
    • Elle fournit un environnement collaboratif d’agents intelligents opérant de manière autonome dans l’éditeur, le terminal et le navigateur
  • Le développeur prend le rôle de concepteur, tandis que les agents se chargent de l’implémentation des fonctionnalités, des itérations UI, de la correction de bugs, de la recherche et de la génération de rapports
  • Une preview publique téléchargeable gratuitement est disponible pour macOS, Windows et Linux

API Gemini

  • Grâce à l’outil bash côté client, le modèle peut suggérer des commandes shell et automatiser des tâches système
  • L’outil bash côté serveur prend en charge la génération de code dans plusieurs langages ainsi que le prototypage sécurisé
  • Il est possible de combiner l’ancrage aux données basé sur Google Search (Grounding) et la fonctionnalité URL context avec des sorties structurées
    • Après collecte et extraction des données, celles-ci peuvent être utilisées dans des tâches d’agent en aval

Vibe coding

  • Gemini 3 Pro propose une fonctionnalité de vibe coding qui permet de créer des applications uniquement en langage naturel
    • Grâce à une meilleure compréhension d’instructions complexes et à une meilleure utilisation des outils, il peut générer une application interactive complète à partir d’un seul prompt
  • Il a obtenu un score de 1487 Elo sur le classement WebDev Arena
  • Les performances ont été renforcées dans les workflows UI/frontend de la plateforme de développement d’applications full-stack d’Emergent
  • Dans Google AI Studio, il est possible de créer des jeux ou des applications à partir de notes vocales ou d’esquisses
    • Le Build mode connecte automatiquement le modèle et l’API afin d’ajouter rapidement des fonctionnalités IA

Compréhension multimodale (Multimodal Understanding)

  • Gemini 3 a atteint les meilleures performances sur MMMU-Pro et Video MMMU
    • Il établit une nouvelle référence pour le raisonnement sur des images et vidéos complexes
  • Sa fenêtre de contexte d’un million de tokens améliore l’efficacité du développement d’applications multimodales
  • Il est possible d’ajuster finement la résolution de traitement visuel (media resolution) afin de contrôler la latence et les coûts

Raisonnement visuel (Visual Reasoning)

  • Il va au-delà de l’OCR simple pour effectuer de la compréhension et du raisonnement sur des documents
  • Une application de démonstration permet de transformer de simples entrées d’image en expériences web interactives

Raisonnement spatial (Spatial Reasoning)

  • Les capacités de compréhension spatiale ont été renforcées pour le pointage, la prédiction de trajectoire et le suivi de progression des tâches
    • Elles peuvent être exploitées dans la conduite autonome, la XR ou encore la robotique
  • Les fonctions de compréhension de l’écran et de reconnaissance du comportement utilisateur améliorent les performances dans les environnements desktop et mobile
    • Le modèle déduit l’intention de l’utilisateur à partir des mouvements de souris et des annotations

Raisonnement vidéo (Video Reasoning)

  • La compréhension à haute fréquence d’images permet de capter des détails même dans des scènes rapides
  • Grâce à une mémoire de contexte longue durée, il peut structurer une narration et extraire des détails à partir de vidéos de plusieurs heures
  • Dans l’environnement Agent Opus, la vitesse a progressé de 32 %, avec une amélioration de la précision et de la fiabilité dans l’exécution de commandes complexes

Intégration et usages pour les développeurs

  • L’intégration dans les applications est immédiatement possible via l’API Gemini
    • De nouveaux paramètres thinking level, media resolution et thought signatures ont été ajoutés
  • Une architecture orientée agents est prise en charge dans Gemini CLI, l’application Android et Google Antigravity
  • Le Build mode de Google AI Studio permet de générer une application à partir d’un seul prompt
    • La fonctionnalité I’m feeling lucky automatise l’implémentation de code créatif

Conclusion

  • Gemini 3 Pro marque un tournant pour les environnements de développement centrés sur l’IA, en s’intégrant aux workflows existants tout en proposant de nouvelles méthodes de développement
  • Google fournit aux développeurs des outils qui repoussent les limites de ce qu’il est possible de faire avec l’IA
  • Cela annonce le début de l’ère Gemini 3, avec l’espoir que les développeurs s’en servent pour créer de nouvelles innovations

2 commentaires

 
iolothebard 2025-11-26

Avec la fonctionnalité vibe coding intégrée !! mdr