Google est en train de gagner sur tous les fronts de l’IA
(thealgorithmicbridge.com)- Google domine ses concurrents sur l’ensemble du champ de l’IA, en matière de performance des modèles, de compétitivité tarifaire et d’intégration dans ses produits, et s’assure ainsi la position de leader dans tous les domaines de l’IA
- Autour de Gemini 2.5 Pro, l’entreprise présente un large éventail de technologies d’IA générative — texte, image, musique, vidéo, voix, agents — qu’elle intègre rapidement à l’écosystème Google
- Avec son infrastructure cloud, son matériel dédié à l’IA et jusqu’aux smartphones, Google dispose d’une structure bien plus favorable qu’OpenAI ou Anthropic pour mener l’ère de l’IA
Le retour de DeepMind et la supériorité globale de Google dans l’IA
- L’auteur se dit fan de DeepMind depuis longtemps et se souvient qu’AlphaGo et AlphaZero, plus encore que ChatGPT, représentaient les moments les plus fascinants de la véritable IA
- Google aurait pu prendre une avance suffisante avant la sortie de ChatGPT, mais a laissé passer cette opportunité à cause d’une prudence excessive destinée à protéger ses revenus publicitaires liés à la recherche
- Depuis, Google et DeepMind n’ont pas répété cette erreur et mènent désormais la course sur l’ensemble du secteur de l’IA
Les performances sans précédent de Gemini 2.5 Pro
-
Gemini 2.5 Pro Experimental se classe n°1 dans de nombreux benchmarks publics comme privés
- LMArena, GPQA Diamond, Humanity’s Last Exam, AIME (mathématiques), Aider Polyglot (code), Live Bench (diversité), etc.
- Il ferait mieux que Claude Sonnet pour jouer à Pokémon et progresse rapidement aussi sur Minecraft Bench
- Il obtient également d’excellents résultats en écriture créative et en compréhension de longs contextes
-
Les retours des utilisateurs vont aussi massivement dans le sens de Gemini 2.5 Pro comme meilleur modèle du secteur
- Sur Reddit, X et ailleurs, de nombreux utilisateurs partagent leurs expériences concrètes pour en démontrer la supériorité
-
Il se distingue sur tous les plans : vitesse, prix et fonctionnalités
- Rapide, peu coûteux, avec une fenêtre de contexte de 1 million de tokens
- Son intégration dans la suite de produits Google (Gmail, Docs, Maps, etc.) est prévue
Le modèle allégé Gemini Flash et l’open source Gemma 3
- Gemini 2.5 Flash est un modèle allégé, optimisé pour les environnements mobiles et edge
- Rapide, très bon marché, il offre un excellent rapport qualité-prix aux côtés des précédentes versions Flash, Flash Lite et Flash Thinking
- Gemma 3 est le modèle open source de Google, capable de rivaliser avec Llama 4 et DeepSeek-V3
L’équilibre parfait entre prix et performances
- Google domine la frontière de Pareto aussi bien sur les modèles très performants que sur les modèles à bas coût
- Les modèles haut de gamme restent économiquement efficaces, tandis que les modèles bon marché offrent eux aussi des performances solides
Une avance sur tous les segments de l’IA générative
- Au-delà des modèles textuels, Gemini est aussi au meilleur niveau en musique (Lyria), image (Imagen 3), vidéo (Veo 2) et voix (Chirp 3)
- Veo 2 est jugé plus applicable dans le monde réel que Sora d’OpenAI
Systèmes d’agents et technologies d’interface
- Le mode Deep Research de Gemini 2.5 Pro serait deux fois meilleur que celui d’OpenAI
- Plusieurs projets sont en cours, comme Project Astra (agent de type assistant) et Project Mariner (interface informatique)
- Le support du protocole Agent2Agent et du Model Context Protocol est également prévu
Des résultats de recherche continus et une contribution académique majeure
- Google DeepMind publie régulièrement des articles dans des conférences et revues de premier plan comme Nature, ICLR et NeurIPS
- L’entreprise aborde aussi l’AGI et l’IA industrielle avec un fort sens des responsabilités
L’écosystème Google et l’intégration de l’IA
- Google est à la fois une entreprise d’IA et un éditeur de logiciels grand public, capable d’intégrer l’IA à l’ensemble de ses produits
- Recherche, YouTube, Android, Gmail, Chrome : l’IA doit être déployée dans 7 produits comptant chacun 2 milliards d’utilisateurs mensuels
- Une fois Gemini intégré à tout l’écosystème Google, il pourrait devenir la meilleure IA fournie par défaut à des milliards d’utilisateurs
L’avantage compétitif dans le cloud et les infrastructures matérielles
- Via Google Cloud, Google loue des puces pour les modèles d’IA et développe aussi ses propres TPU (Ironwood v7)
- Microsoft soutient OpenAI dans le cloud, Amazon soutient Anthropic, mais Google absorbe tout au sein de son propre écosystème
- Dans le matériel pour l’IA aussi, l’entreprise est en concurrence avec Nvidia
Une offensive également sur le marché des smartphones
- Google intègre Gemini par défaut au Pixel 9, ce qui lui permet aussi de rivaliser avec Apple et Samsung
- Des fonctions d’IA comme le partage d’écran ou le contrôle de la caméra sont déjà concrètement mises en œuvre
- Les wearables et appareils IA tentés par d’autres entreprises sont, eux, en train d’échouer
Conclusion : l’avantage décisif de Google + DeepMind
- L’auteur se dit stupéfait de la domination tous azimuts de Google, au point de s’étonner d’avoir autrefois davantage attendu d’OpenAI, d’Anthropic ou de Meta
- Il continuera à observer les contre-attaques des concurrents, mais à ce stade, Google apparaît clairement comme le grand gagnant de la guerre de l’IA
8 commentaires
Il n’y a peut-être pas de modèles qui battent GPT-4.5 sur les specs, mais... rien qu’en leur demandant une simple traduction, leurs capacités de construction de phrases ne sont même pas comparables. (GPT l’emporte largement)
J’ai l’impression qu’il faut désormais aussi débattre de la manière de concevoir les benchmarks et les jeux de test.
Et puis on entend assez souvent dire que les performances des LLM eux-mêmes sont en deçà des attentes sur des tâches générales...
« L’auteur est depuis longtemps un fan de DeepMind, »
J’ai testé rapidement la 2.5 aussi, mais bon… au final, je me demande si GPT n’est pas meilleur ; c’est peut-être une question de préférence personnelle ?
Moi aussi, j’utilise désormais davantage Gemini. J’ai eu l’impression d’un écart qui se creuse de plus en plus.
J’ai aussi l’impression que GPT est meilleur..
J’ai trouvé que gemini 2.5 fournissait des réponses d’une qualité bien supérieure à celles de gpt, claude et grok3.
Surtout, récemment, gpt est devenu tellement lent qu’il était pénible à utiliser.
Avis Hacker News
En tant qu’ancien employé d’OpenAI, j’ai constaté que de nombreux talents majeurs du ML ont quitté OpenAI pour rejoindre d’autres startups. L’application ChatGPT est le principal produit à succès d’OpenAI, mais les revenus tirés des abonnements ont leurs limites. On peut s’attendre bientôt à une offre gratuite, et la publicité deviendra probablement la principale option de monétisation. Google est mal à l’aise face à la stratégie d’acquisition d’utilisateurs d’OpenAI. Google doit livrer rapidement l’innovation aux utilisateurs
Cet article ne mentionne pas les TPU. L’écosystème JAX + TPU de Google est excellent. Google dispose de ses propres solutions de calcul, ce qui lui donne un avantage dans la compétition. Les entreprises d’IA doivent répondre à la question : « Que pouvez-vous faire que personne d’autre ne peut faire ? » L’avantage matériel de Google apporte une vraie réponse à cette question
Les avis sur le leader du secteur du ML changent souvent. Il y a quelques mois, je pensais que Google avait échoué, mais aujourd’hui, c’est OpenAI qui perd en popularité. Google s’en sort bien en ce moment, mais dans quelques mois la situation pourrait être totalement différente
Google a des faiblesses en matière de marketing, de confiance, de sécurité et de part de marché. Cependant, le modèle Gemini Pro 2.5 est excellent
Certains pensent que les LLM peuvent être financés par la publicité. Un "adsense" fondé sur les LLM pourrait fonctionner de manière très subtile et habile. La publicité pourrait être insérée naturellement au cours de la conversation
Un utilisateur de Claude a essayé Gemini 2.5 et s’en est dit satisfait grâce à l’écosystème intégré de Google. Google réussit une nouvelle fois
En plus de Gemini 2.5 Pro, Gemini 2.0 Flash est aussi un modèle polyvalent. Il est peu coûteux, multimodal et offre une vitesse fiable. Une API temps réel est également proposée
Gemini 2.5 Pro est deux fois meilleur que Deep Research d’OpenAI. Le Deep Research de Google est plus profond, plus complet et plus incisif
Gemini 2.5 Pro est très puissant. Cependant, à cause de problèmes d’interface web, j’utilise aussi Claude Sonnet 3.7. Google s’appuie sur le plus grand moteur de recherche et sur YouTube pour développer l’IA
Tant que Google se limitera lui-même à cause de la censure, je ne pourrai pas utiliser ses produits. Gemini 2.5 Pro n’a pas pu répondre à certaines questions. ChatGPT 4o, lui, a fourni la bonne réponse
On dirait qu’il a pris des cours particuliers hyper ciblés à la coréenne… il excelle juste aux examens.
Mais dès qu’on discute vraiment avec lui… il est plutôt à côté de la plaque.