- Google a lancé en avance Gemini 2.5 Pro Preview (I/O Edition), avant l’événement I/O officiel, afin d’intégrer les retours des développeurs et d’améliorer les performances
- Le modèle affiche des performances particulièrement solides en développement frontend et UI, avec des progrès en transformation de code, édition et jugement d’abstraction
- Grâce à une performance de 84,8 % sur le benchmark VideoMME, il devient possible de générer automatiquement des applications d’apprentissage à partir de vidéos
- Le raisonnement sur le design permet aussi de créer facilement des UI adaptées au style souhaité et d’y ajouter des fonctionnalités
- La version du 25 mars sera automatiquement mise à jour vers celle du 6 mai, ce qui permet de bénéficier du modèle amélioré sans travail supplémentaire
Excellentes performances en développement frontend
- Gemini 2.5 Pro occupe la 1re place du classement WebDev Arena
- Il démontre des performances de tout premier plan dans les évaluations de préférence humaine, selon des critères d’UI esthétiques et de complétude fonctionnelle
- En collaboration avec Cognition et Replit, Google élargit les possibilités de la programmation agentique
Combinaison de compréhension du code et de capacité de raisonnement
-
Vidéo → code
- Avec une performance de 84,8 % sur le benchmark VideoMME, le modèle atteint un niveau SOTA en compréhension vidéo
- Il peut générer automatiquement des applications d’apprentissage interactives à partir de vidéos YouTube
- Il produit des résultats avec une UI globale et un niveau d’interaction améliorés par rapport à la version précédente
-
Automatisation du développement de fonctionnalités
- Jusqu’ici, il fallait ouvrir les fichiers du designer et transformer manuellement en CSS les couleurs, polices, marges, etc.
- Gemini 2.5 Pro peut générer automatiquement des composants adaptés au style souhaité
- Exemple : il peut automatiser l’ajout d’une fonction de lecteur vidéo cohérente avec le style de l’application Gemini 95
-
Accélération du passage de l’idée à l’application
- Comme dans l’exemple de l’application de dictée de démarrage, il peut créer des applications en prenant en compte à la fois la fonctionnalité et la qualité esthétique
- Génération automatique d’éléments UI détaillés comme des animations de forme d’onde, du design responsive et des effets au survol de la souris
- Même sans intervention directe de l’utilisateur sur le design, il génère par défaut des résultats visuellement soignés
Prise en compte des retours développeurs et mode d’utilisation
- Par rapport à la version précédente, le modèle réduit le taux d’erreur des appels de fonction et améliore le déclenchement des appels
- La version 03-25 pointera automatiquement vers la version 05-06 → application sans mise à jour séparée
- Disponible immédiatement dans Google AI Studio et Vertex AI
- La fiche du modèle a également été mise à jour avec les dernières informations
- La mise à jour vers la dernière version est automatique, sans changement de prix
Cas d’usage et attentes
- Replit, Cursor, Cognition et d’autres envisagent ou appliquent déjà son adoption comme agent de code de nouvelle génération
- Du développeur individuel aux entreprises, il devrait contribuer à la diffusion des flux de développement agentiques
1 commentaires
Avis sur Hacker News
Par le passé, le principal reproche quand on utilisait ce type de modèles pour programmer était leur tendance à inventer des API inexistantes. Les modèles Gemini 2.5, en particulier les versions Pro et Flash, souffrent moins de ce problème que les autres modèles
Gemini 2.5 Pro a pris la première place du classement WebDev Arena
Quand on demande du code à Gemini 2.5, il produit trop de commentaires
Gemini 2.5 excelle dans les tâches agentiques, mais a encore du mal à générer des diffs parfaits pour l’édition de code
Question à un représentant de Google : je me demande si Gemini-2.5-pro-exp (version gratuite) a aussi été mis à jour, ou s’il va disparaître
En comparant les benchmarks de l’expérimental 03-25 et de l’expérimental 05-06, la nouvelle version obtient des scores légèrement inférieurs partout sauf sur LiveCodeBench
J’utilise Gemini pour presque tout, mais la model card ne le compare qu’à o3-mini
Gemini 2.5 Pro est excellent, mais l’interface a encore des problèmes de défilement qui la rendent difficile à utiliser
ms-code-blockdans les outils de développement et d’afficher$0.textContextGemini 2.5 Pro est excellent, mais son coût est très élevé et la visibilité sur les coûts reste opaque
Ce modèle est moins performant que la 03-25 sur 10 benchmarks sur 12
Je me demande pourquoi ils ne peuvent pas utiliser un numéro de version au lieu de « nouvelle preview »