- La fonctionnalité Gemini 2.5 Deep Think est lancée dans l'application Gemini pour les abonnés Google AI Ultra uniquement
- Grâce à une nouvelle technique de pensée parallèle (parallel thinking) et aux résultats de recherche intégrés, elle a été améliorée à partir d'un modèle de niveau médaille d'or à l'IMO afin d'être plus adaptée à l'usage réel
- Elle affiche d'excellentes performances sur une variété de tâches complexes, notamment la résolution créative de problèmes, le raisonnement mathématique et scientifique, et le développement d'algorithmes
- Pour améliorer la performance, le temps de réflexion (Thinking Time) est augmenté afin d'explorer simultanément différentes idées et solutions, générant ainsi une réflexion plus profonde et des résultats plus créatifs
- Des évaluations et des actions renforcées sont menées pour une sécurité et un développement responsable de l'IA, avec un élargissement prévu des usages via API et entreprise
Lancement de Gemini 2.5 Deep Think
- La fonctionnalité Gemini 2.5 Deep Think est mise à disposition des abonnés Google AI Ultra via l'application Gemini
- Version intégrant les retours de testeurs et de chercheurs de confiance ainsi que les dernières avancées de recherche
- Basée sur un modèle de niveau médaille d'or de la récente Olympiade internationale de mathématiques (IMO), elle améliore vitesse et utilité pratique pour mieux correspondre à l'expérience utilisateur réelle
- Cette annonce élargit son potentiel en tant qu'outil de résolution créative de problèmes, et une sophistication progressive de la fonction est prévue à partir des retours de mathématiciens et de chercheurs
Principe de fonctionnement de Deep Think
- En introduisant une méthode de pensée parallèle, Gemini explore, compare et combine simultanément plusieurs idées et solutions pour résoudre des problèmes complexes
- En allongeant le temps de raisonnement (Thinking Time) du modèle, il explore plus en profondeur plusieurs hypothèses pour trouver des solutions plus créatives
- L'apprentissage par renforcement permet au modèle d'exploiter efficacement ces chemins de raisonnement étendus, renforçant une capacité de résolution de problèmes plus intuitive et plus profonde
Principales performances et cas d'usage de Deep Think
- Développement et conception progressifs : de très bonnes performances sur les tâches qui font évoluer étape par étape des systèmes ou des designs complexes
- Découvertes scientifiques et mathématiques : des atouts pour les explorations créatives de haut niveau, comme le raisonnement mathématique ou l'interprétation d'articles scientifiques
- Développement d'algorithmes et de code : atteint des performances de pointe sur des problèmes de codage difficiles qui demandent structuration du problème, prise en compte de la complexité temporelle et des compromis
- Sur des benchmarks récents (par exemple LiveCodeBench V6, Humanity’s Last Exam), il démontre des performances de premier plan en code, connaissances et raisonnement par rapport aux modèles précédents
Développement responsable et sûreté de Gemini
- Gemini 2.5 Deep Think affiche de meilleurs résultats de sûreté que les modèles Pro existants, avec un contenu plus sûr et un ton plus objectif dans les évaluations de sécurité
- La hausse de la complexité implique également une évaluation des risques associés, avec un renforcement des évaluations Frontier Safety et des mesures de mitigation nécessaires
- Les résultats de sûreté détaillés sont consultables dans la model card
Utilisation de Deep Think
- Les abonnés Google AI Ultra peuvent l'utiliser un nombre limité de fois par jour dans l'application Gemini en sélectionnant 2.5 Pro dans le menu déroulant du modèle puis en activant le toggle Deep Think dans la barre de prompt
- Il s'intègre automatiquement à des outils comme l'exécution de code et Google Search, et permet la génération de réponses nettement plus longues
- Des tests supplémentaires pour l'API Gemini et l'usage entreprise sont prévus prochainement
1 commentaires
Commentaires sur Hacker News
J’ai testé le nouvel agent Deep Think, mais après avoir saisi seulement cinq prompts, j’avais déjà atteint la limite d’utilisation quotidienne. Pour un service à 250 $ par mois, c’est assez décevant. Le rapport qualité-prix est nettement inférieur à celui de o3-pro ou de Grok 4 Heavy. Dans la communauté IA, c’est ce qui avait suscité le plus d’intérêt comme seule fonctionnalité capable de justifier à peu près le prix de l’abonnement Google Ultra. Mais Google offre gratuitement son meilleur modèle dans AI Studio, tout en appliquant ce type de politique tarifaire à ses vrais abonnés payants Ultra, ce que je ne comprends absolument pas. Côté performances, en lui donnant un problème métier difficile, il a fourni une solution claire et convaincante, conforme aux conclusions de nos réunions internes. Mais au final, o3 est aussi arrivé à une conclusion similaire pour un prix bien plus bas. Le rapport de o3 paraissait simplement un peu moins bien structuré. Il faudra voir après plus d’usage
Voilà le résultat obtenu après avoir donné à Gemini Deep Think le prompt « dessine une image SVG d’un pélican à vélo » https://www.svgviewer.dev/s/5R5iTexQ Je l’ai fait avant Simon Willison !
Si vous voulez l’essayer vous-même, vous pouvez utiliser le CLI
llmde simonw et le pluginllm-consortiumAvantage 1 : on peut combiner librement plusieurs modèles. On peut configurer n’importe quelle combinaison, quel que soit le laboAvantage 2 : en utilisant le pluginllm-model-gateway, on peut tout connecter d’un coup via une API locale à son app ou à son outil de collaboration de code https://x.com/karpathy/status/1870692546969735361Il a même écrit lui-même l’installation, des commandes d’exemple, ainsi qu’un exemple montrant qu’on peut créer un consortium of consortium aussi.
https://GitHub.com/irthomasthomas/llm-consortium
llm serveCe n’est pas le modèle qui a remporté l’or aux IMO (Olympiades internationales de mathématiques) il y a quelques semaines, mais une variante très proche https://x.com/OfficialLoganK/status/1951262261512659430 Il n’est toujours pas proposé via API
Cette approche ressemble à Grok 4 Heavy : plusieurs agents de « raisonnement » tournent en parallèle, comparent ensuite leurs réponses et reviennent avec celle jugée la meilleure, en environ 30 minutes. Le résultat est excellent, mais en pratique il faudrait comparer les benchmarks à Grok 4 Heavy plutôt qu’à Grok 4 (agent unique, modèle plus rapide) pour que ce soit équitable
OpenAI est monté à 200 $, Anthropic à 100 $ et 200 $, Gemini à 250 $, et Grok jusqu’à 300 $. OpenAI est le seul à parler d’un usage « pratiquement illimité », et je n’ai en effet jamais atteint de limite avec le plan ChatGPT Pro. En revanche, avec Claude Max, j’ai atteint la limite plusieurs fois. Je me demande pourquoi ces entreprises ne publient pas clairement leurs plafonds
Ces derniers mois, en utilisant Gemini, j’ai au contraire l’impression qu’il devient de pire en pire. Il hallucine beaucoup trop souvent, et même quand on le lui signale, l’IA s’obstine. Il devient difficile de lui faire confiance
Les abonnés Google AI Ultra peuvent utiliser Deep Think dans l’app Gemini à partir d’aujourd’hui, avec un nombre fixe de prompts fournis. Mais j’aimerais savoir plus précisément si cet « ensemble fixe » désigne un nombre fixe de requêtes, ou bien des types de prompts prédéfinis
Quand j’utilise Gemini CLI pour planifier un agenda, même si je lui indique clairement à plusieurs reprises de ne pas faire d’actions imprévues et que j’interviens, il essaie souvent de modifier les choses arbitrairement et finit par désorganiser tout le plan