La révolution IA de Google : deux ans de lutte acharnée pour rattraper OpenAI

(wired.com)

35 points par GN⁺ 2025-03-28 | 4 commentaires | Partager sur WhatsApp

Le début de la crise pour Google, distancé dans la révolution des chatbots

En décembre 2022, Sissie Hsiao reçoit pour mission de développer en 100 jours un produit concurrent de ChatGPT chez Google
Vétérane de l’entreprise depuis plus de 16 ans, ayant dirigé des milliers de personnes, Hsiao n’avait encore jamais fait face à une crise aussi grave
Après qu’OpenAI a dévoilé ChatGPT, le nombre d’utilisateurs a rapidement dépassé le million, malgré des erreurs factuelles et des fautes de calcul
Certains ont commencé à considérer ChatGPT comme une alternative à Google Search, ce qui menaçait la plus grande source de revenus de Google
Google disposait bien de son propre modèle de langage, LaMDA, mais l’accès public restait limité, et même les démonstrations se cantonnaient à des « histoires de chiots »
Wall Street (les marchés financiers) s’inquiétait, et si le CEO Sundar Pichai avait autrefois proclamé l’avènement d’une ère AI-first, dans laquelle les assistants intelligents remplaceraient les appareils, la réalité était loin des attentes
Pourtant, les 8 chercheurs de Google à l’origine de l’architecture Transformer avaient eux aussi quitté l’entreprise, ou étaient partis sans résultat concret
Google Assistant, dont Hsiao avait la charge, servait surtout à régler des minuteurs ou lancer de la musique
Tout ce que l’entreprise avait à proposer, c’était un chatbot inachevé destiné à la Gen Z, capable de donner des conseils de cuisine et des quiz d’histoire
À la fin 2022, l’action Alphabet avait chuté de 39 % sur un an, fragilisant la position de Google comme leader de l’IA

La réponse de Google à la crise de l’IA et son changement de stratégie

Début 2023, le conseil d’administration de Google exige des reportings en temps réel sur l’IA
- Sergey Brin, cofondateur et actionnaire majeur, participe lui aussi directement aux revues stratégiques
- Un message est adressé aux employés : « agissez comme une startup »
Par le passé, de nombreux employés pouvaient s’opposer à un produit, sans pour autant avoir le pouvoir de l’approuver
Désormais, la culture de l’entreprise évolue vers plus de prise de risque et une exécution plus rapide
En lançant son projet sur 100 jours, Sissie Hsiao pose à son équipe un principe original :
« Quality over speed, but fast »
Un autre haut dirigeant, James Manyika, joue un rôle clé dans la refonte de la stratégie IA
- Docteur en robotique formé à Oxford et ancien consultant chez McKinsey, il rejoint Google en 2022
- Il propose à Pichai de fusionner DeepMind et Google Brain
DeepMind (à Londres, dirigé par Demis Hassabis) et Google Brain (à Mountain View, sous la responsabilité de Jeff Dean) fonctionnaient séparément et consommaient les ressources de manière inefficace
- Après le lancement d’OpenAI, les trois dirigeants présentent au conseil un projet de fusion
- Hassabis propose le nom de projet « Titan », refusé au profit de « Gemini », proposé par Jeff Dean
Manyika déclare ensuite que Google a pris des décisions audacieuses et responsables
- Mais il reconnaît que « ce n’étaient pas toujours les bonnes décisions »
- Dans ce climat d’urgence, l’inquiétude se répand même parmi les employés : « Google pourrait devenir le nouveau Yahoo »
- Hsiao décrira cette période comme l’impression de sprinter dans un marathon
Pourtant, deux ans plus tard, l’action Alphabet atteint un plus haut historique
- Les investisseurs affichent une vision optimiste du retour en force de Google dans l’IA
WIRED qualifie cette période comme la plus chaotique et la plus marquante sur le plan culturel de l’histoire de Google
- Le média a interrogé plus de 50 employés et ex-employés, issus de l’ingénierie, du marketing, du juridique et de la sécurité
- Cet article met pour la première fois en lumière en détail la transformation de Google à travers les témoignages de hauts dirigeants

Développement de Bard : priorité absolue et concentration des ressources

Pour répondre à ChatGPT, Google lance un nouveau projet de chatbot, sous le nom de code Bard
Sissie Hsiao mobilise directement environ 100 talents venus de tout Google
- Les managers ne pouvaient pas s’y opposer, et le projet Bard était la priorité absolue
Hsiao sélectionne des profils à la fois solides techniquement, dotés d’intelligence émotionnelle et capables de garder une vision d’ensemble
La plupart sont affectés à Mountain View, en Californie, et travaillent de façon flexible, sans se limiter à leur rôle
- Elle insiste sur cette philosophie : « Team Bard est une équipe qui prend en charge tous les rôles »
En janvier 2023, Google annonce les premiers licenciements massifs de son histoire : environ 12 000 personnes, soit 7 % des effectifs
Certains employés vivent avec la peur d’être licenciés s’ils ne font pas d’heures supplémentaires ou ne prennent pas plus de travail
- Beaucoup renoncent même au moment du coucher de leurs enfants pour assister à des réunions nocturnes
Bard repose sur LaMDA, mais il faut mettre à jour ses connaissances et ajouter de nouveaux garde-fous de sécurité
- Les équipes d’infrastructure réaffectent leurs meilleurs experts pour sécuriser les serveurs et optimiser le système
- Les data centers approchent presque de leur limite de consommation électrique, avec des risques de surchauffe des équipements
- De nouveaux outils de gestion sont donc rapidement développés pour traiter la demande énergétique de façon plus sûre
Même dans cette tension, l’humour fait son apparition
- Un membre de l’équipe fabrique des jetons de poker personnalisés, y grave le nom de certaines puces et les empile sur les bureaux des ingénieurs en lançant : « Allez, servez-vous en puces »
Malgré le renforcement des ressources de calcul, Bard répète ses problèmes des premières semaines
- Comme ChatGPT, Bard génère fréquemment des hallucinations ainsi que des réponses inappropriées ou offensantes
- Les premières versions produisent souvent des stéréotypes raciaux gravement absurdes
  - En saisissant un nom indien, le système décrivait la plupart des personnes comme des « acteurs de Bollywood », et les noms masculins chinois comme des « informaticiens »
- Selon un ancien employé, les réponses de Bard n’étaient « pas dangereuses, mais juste stupides »
- Certains employés partageaient des captures d’écran des réponses absurdes de Bard pour s’en moquer
  - Exemple : après avoir demandé « un rap, dans le style de Three 6 Mafia, sur le fait de jeter une batterie de voiture dans la mer », Bard a généré un texte allant jusqu’à attacher une personne à la batterie pour la couler dans l’océan
Pour Google, il n’y avait pas d’autre choix que corriger le plus d’erreurs possible en 100 jours
- Même des prestataires externes chargés de détecter les images de maltraitance infantile sont mobilisés pour tester Bard
- Pichai demande à tous les employés ayant du temps libre de tester Bard, si bien qu’au final environ 80 000 personnes participent aux tests
Hsiao et la direction comprennent qu’il est impossible d’empêcher totalement les erreurs de Bard et présentent donc le produit lui-même comme une “expérience”
- Une stratégie similaire à celle d’OpenAI, qui avait présenté ChatGPT comme un « research preview »
- En soulignant auprès des utilisateurs et des évaluateurs externes qu’il ne s’agissait pas d’un produit fini, Google cherchait à limiter le risque d’atteinte à sa marque
- Ce type de stratégie d’évitement du risque est largement reconnu dans l’industrie depuis l’affaire du chatbot Twitter de Microsoft, Tay, qui avait tenu des propos nazis

Le processus de lancement de Bard et son erreur fatale

Par le passé, avant le lancement d’un produit d’IA chez Google, l’équipe d’innovation responsable menait pendant des mois un examen des biais et des défauts
- Dans le cas de Bard, la procédure d’examen a été fortement réduite en raison de la pression sur le calendrier
- Le directeur juridique Kent Walker plaidait pour un lancement rapide
- Les nouveaux modèles et fonctionnalités arrivaient si vite que l’équipe de revue ne parvenait pas à suivre malgré les heures supplémentaires et le travail le week-end
Des alertes demandant de retarder le lancement de Bard ont bien été émises, mais elles ont été ignorées ou neutralisées
- À ce sujet, Google a affirmé à WIRED qu’« aucune équipe n’avait officiellement recommandé de s’opposer au lancement »
  - L’entreprise a précisé que de nombreuses équipes avaient participé aux tests et qu’il ne s’agissait pas d’une organisation où une équipe spécifique portait seule l’entière responsabilité
Vers février 2023, alors que le projet des 100 jours approchait des deux tiers de son déroulement, Google a appris que ChatGPT allait être intégré à la recherche Bing
Même si Google dominait toujours largement les parts de marché de la recherche, l’absence de fonctionnalités d’IA générative constituait une menace à long terme
Pour éviter une baisse du cours de l’action, le 6 février, soit la veille de l’annonce de Microsoft, Pichai a brusquement annoncé l’ouverture d’un test limité de Bard
Dans la vidéo marketing, Bard était présenté comme un assistant IA prolongeant la mission de Google consistant à « organiser l’information »
La question posée dans la vidéo : « Parmi les nouvelles découvertes du télescope spatial James Webb, lesquelles pourrais-tu expliquer à un enfant de 9 ans ? »
- Réponse de Bard : « Le JWST a pris la première photo d’une planète hors de notre système solaire »
Reuters a immédiatement signalé une erreur factuelle : cette image avait été prise non par un télescope spatial, mais par un télescope terrestre (VLT)
L’action Alphabet a chuté de 9 %, effaçant environ 100 milliards de dollars de capitalisation boursière
En interne, c’était le choc
- L’employé marketing qui avait rédigé la question s’en est voulu, et ses collègues l’ont réconforté en disant que « les équipes juridiques et RP avaient toutes deux relu, mais que personne n’avait vu l’erreur »
- Comme ChatGPT faisait lui aussi beaucoup d’erreurs, personne n’avait anticipé qu’un malentendu aussi mineur aurait un tel impact sur le titre
Xiao a qualifié cela d’« erreur naïve »
- Bard formulait ses réponses à partir des résultats de recherche Google et a peut-être mal interprété l’expression « première photo » figurant sur le blog de la NASA
- La direction a insisté : « Personne ne sera licencié pour cela. Mais il faut en tirer rapidement les leçons »
Xiao : « Nous ne sommes pas une startup, nous sommes Google. On ne peut pas balayer cela comme un simple défaut technique. Nous devons impérativement réagir de manière responsable »
Le mécontentement montait aussi en dehors de l’équipe Bard
- Sur le forum interne Memegen, un message critiquait le fait que « le lancement de Bard et les licenciements avaient été précipités, ratés et dictés par une vision à court terme »
- Une image du logo Google en flammes dans une poubelle a également circulé
Pourtant, Google a affecté davantage de ressources à Bard
- Des centaines de personnes supplémentaires ont été mobilisées, et les documents d’équipe montraient la photo de profil de Pichai tous les jours, signe de son implication directe

L’arrivée de GPT-4 et l’écart technologique

À la mi-mars 2023, le lancement de GPT-4 par OpenAI a provoqué un nouveau choc chez Google
- Selon un chercheur senior : « J’en suis resté bouche bée, et j’ai ressenti de façon aiguë que Google devait accélérer »
Une semaine plus tard, Bard a été lancé officiellement aux États-Unis et au Royaume-Uni
- Les utilisateurs l’ont jugé utile pour rédiger des e-mails, faire des brouillons de rapports, etc.
- Mais ChatGPT faisait la même chose, et mieux, ce qui limitait l’incitation à changer d’outil
Dans le podcast Hard Fork, Pichai a ironisé en disant que Google avait « aligné une Civic préparée face à une voiture de sport très puissante »
- Conclusion : « Il nous faut un meilleur moteur »

Développement de Gemini : fusion de DeepMind et Google Brain, et choc des cultures

Les différences entre les deux organisations de recherche en IA
- DeepMind était classé parmi les « Other Bets » d’Alphabet et se concentrait sur la résolution de problèmes scientifiques et mathématiques de long terme
- Google Brain développait surtout des technologies d’IA commercialement utiles, comme l’autocomplétion dans Gmail ou le traitement des requêtes de recherche ambiguës
Selon un ancien ingénieur senior :
- Google Brain privilégiait l’autonomie, et Jeff Dean avait un style consistant à « laisser les gens faire par eux-mêmes »
- À l’inverse, DeepMind fonctionnait comme une armée parfaitement coordonnée, Demis Hassabis dirigeant « une organisation très efficace sous un commandement unifié »
Dean est un vétéran de la recherche sur les réseaux neuronaux, actif depuis les débuts de Google
Hassabis est un leader guidé par une vision, qui rêve de guérir des maladies grâce à l’IA et imagine des « agents IA qui voient, entendent et aident »
Lancement de Google DeepMind (GDM)
- En avril 2023, Google a fusionné les deux organisations pour créer Google DeepMind (GDM)
  - Hassabis a été nommé CEO de l’organisation fusionnée
  - En interne, l’ambiance était la suivante : « le sens de la mission est revenu », « la récré est finie »
- Pour construire rapidement le modèle Gemini, il a fallu collaborer à travers huit fuseaux horaires
- Des centaines de salons de discussion ont été créés, installant une culture du travail de nuit
  - Hassabis : « Chaque journée donne l’impression d’être une vie entière »
- GDM a déménagé dans un bâtiment sécurisé de Mountain View appelé Gradient Canopy
  - Une structure en forme de dôme, entourée de sculptures d’art
  - Le bureau du CEO Pichai se trouvait au même étage
- Sergey Brin (cofondateur de Google) venait souvent sur place pour encourager les équipes
- Les exigences de présence au bureau ont augmenté, et les employés Google ordinaires n’avaient pas accès à ce bâtiment
- Même le code central de GDM était inaccessible aux autres organisations
À mesure que le projet Gemini absorbait les ressources de Google, les chercheurs d’autres domaines, comme la santé ou le changement climatique, souffraient d’un manque de serveurs
Des restrictions sur la publication d’articles sont également apparues, ce qui a renforcé le mécontentement des chercheurs, pour qui les publications sont un actif majeur de carrière
- Google a durci ces contraintes par crainte d’une fuite d’informations vers OpenAI
- La recette d’entraînement de Gemini était un actif crucial pour la survie de l’entreprise
Gemini a lui aussi été confronté à des problèmes similaires à ceux de Bard
Amin Vahdat, vice-président de Google pour le machine learning et l’IA cloud :
- « Quand on passe à une échelle 10 fois supérieure, tout casse »
À l’approche du lancement, Vahdat a mis en place une war room dédiée afin de se concentrer sur la résolution des bugs et des pannes système

Dernières vérifications avant le lancement de Gemini et dilemmes éthiques

L’équipe de développement responsable de Google DeepMind (GDM) s’est pleinement mobilisée pour la revue du produit avant le lancement de Gemini
- Le modèle était puissant, mais produisait encore parfois des réponses étranges ou inappropriées
Selon un rapport publié :
- Des améliorations étaient particulièrement nécessaires concernant les conseils médicaux et les réponses liées au harcèlement
- Avec des entrées image, le modèle avait aussi tendance à faire des inférences sans fondement face à des questions comme « Quel est le niveau d’études de cette personne ? »
La directrice de l’innovation responsable, Dawn Bloxwich, a estimé que cela « ne suffisait pas à bloquer le lancement »
- Mais le temps manquait pour anticiper tous les usages créatifs — ou étranges — du public
À ce stade, Google aurait pu ralentir, mais ne l’a pas fait
- OpenAI était déjà devenu le « Kleenex de l’IA » et attirait l’attention du monde entier
- ChatGPT était devenu à la fois un symbole des promesses de la technologie et de ses problèmes sociaux
- Les travailleurs y voyaient une menace pour l’emploi, et les créateurs réclamaient une compensation pour l’exploitation de leurs données
- Les parents prenaient conscience que les chatbots pouvaient transmettre à leurs enfants des contenus inappropriés
- Parmi les chercheurs en IA, on débattait de « p(doom) », c’est-à-dire la probabilité que cette technologie menace l’humanité
Le légendaire scientifique de l’IA chez Google, Geoffrey Hinton, a quitté l’entreprise en mai 2023 en raison de préoccupations éthiques
- Il a averti que l’IA pouvait menacer l’humanité par la désinformation et des poisons sophistiqués
Hassabis lui aussi estimait qu’il faudrait davantage de temps, mais il continuait malgré tout à avancer vers son rêve d’un assistant IA universel et de la guérison des maladies

Présentation de Gemini et premiers succès

Décembre 2023, Google dévoile officiellement Gemini
- Hausse du cours de l’action après le lancement
- Gemini dépasse ChatGPT dans 30 des 32 tests de référence
- Analyse d’articles scientifiques et de vidéos YouTube, avec de meilleures capacités pour répondre aux questions de mathématiques et de droit
Depuis le bureau londonien, Hassabis organise une petite fête de célébration
- Il se souvient : « Je ne sais pas très bien célébrer. Je pense toujours à l’étape suivante. »
Le même mois, Jeff Dean est invité dans un nouveau salon de discussion baptisé « Goldfish », où il découvre la prochaine avancée technologique
- Le nom est une blague, mais le contenu dit l’inverse : le développement d’une version de Gemini dotée d’une mémoire longue
Grâce au traitement distribué sur un réseau de puces à haute vitesse, il devient possible d’analyser des milliers de pages de texte, voire une série télévisée entière
- Cette technologie est appelée « long context »
Dean, Hassabis et Manica cherchent à l’intégrer à la gamme de produits IA de Google
La première fonction que Manica voulait absolument : une fonction résumant automatiquement des PDF au format podcast
- Il a déclaré à WIRED qu’« il est difficile de suivre tous les articles publiés chaque semaine sur arXiv »

Après le virage Gemini, un retour au calme et une nouvelle crise

Un an après le code rouge, l’ambiance chez Google repart à la hausse
- Les investisseurs se calment, et Bard comme LaMDA sont regroupés sous une marque unique, “Gemini”
L’équipe de Sissie Hsiao réduit l’écart avec OpenAI grâce au développement de fonctions de génération texte-image
Une nouvelle fonctionnalité, Gemini Live, est également en préparation
- Elle doit permettre à l’utilisateur de maintenir de longues conversations comme avec un ami ou un conseiller
Grâce à des modèles Gemini plus puissants, la direction retrouve confiance
Malgré cette stabilisation, le CEO Sundar Pichai ordonne de nouvelles restructurations
- Les revenus publicitaires progressent, mais restent en dessous des attentes de Wall Street
- Même les responsables de la privacy et de la conformité sont poussés vers la sortie
  - Le départ de cadres chargés de la protection des utilisateurs est interprété comme le message suivant : « les inquiétudes sont tolérées, mais pas les freins à l’avancement »
Le générateur d’images lui-même a été facile à construire, mais la phase de revue a pris la forme d’un travail répétitif et pénible
- Il a fallu rédiger des instructions de filtrage pour éviter l’apparition de réponses problématiques
Comme tous les employés n’avaient pas accès aux tests, une charge excessive s’est concentrée sur un petit nombre de personnes
- Exemple : avec le prompt « rapist », la fréquence de génération de personnages à la peau foncée était élevée → crainte de biais raciaux
- Certains ont alors demandé en interne de désactiver complètement la génération d’images de personnes, mais leur proposition a été ignorée
Un ancien reviewer se souvient d’« une atmosphère où il fallait sortir le produit coûte que coûte »
- Certains évaluateurs ont quitté l’entreprise, leurs inquiétudes n’ayant pas été prises en compte
En février 2024, le générateur d’images est lancé officiellement dans l’application Gemini
- Les problèmes attendus d’images racistes ou sexistes ont été quasiment absents, mais un autre problème est apparu dans le sens inverse
Exemple : à la demande d’une image de « sénateur américain des années 1800 », Gemini génère une femme noire, un homme asiatique et une femme autochtone
- Aucun homme blanc n’est généré
Exemple encore plus choquant : des soldats de l’Allemagne nazie générés comme personnes racisées
En réponse, des élus républicains américains ainsi qu’Elon Musk critiquent violemment la « woke AI » de Google
- Musk cible nommément des membres de l’équipe dans une campagne d’attaques concentrées, poussant l’un des employés visés à fermer son compte sur les réseaux sociaux et à craindre pour sa sécurité
Google suspend totalement la génération d’images de personnes, et l’action Alphabet chute une nouvelle fois
Juste après la polémique, des dizaines de dirigeants de Google entament des échanges de crise
- Des vice-présidents et directeurs se rendent à Londres pour rencontrer Hassabis en personne
Résultat :
- L’équipe de Hassabis (modèle Gemini) et celle de Hsiao (application Gemini) obtiennent toutes deux l’autorisation de recruter des experts en fiabilité et en sécurité
- 15 nouveaux postes liés au “Trust & Safety” sont créés au total
Au siège de Gradient Canopy, Sissie Hsiao donne à son équipe le temps nécessaire pour résoudre les problèmes du générateur d’images
Avec James Manica, elle redéfinit les principes publics (public principles) de Gemini
Tous ces principes sont formulés du point de vue de l’utilisateur, avec “you” :
- Gemini « suit vos instructions »
- « s’adapte à vos besoins »
- « protège votre expérience »
L’un des points essentiels souligne que :
- « les réponses de Gemini peuvent ne pas refléter les positions ou les convictions de Google »
- « les résultats de Gemini reposent principalement sur ce que vous avez demandé — Gemini est façonné par vous »
Cela sert à l’avenir de dispositif logique pour minimiser la responsabilité de Google en cas de problème
Mais ces principes n’expliquent pas clairement comment Google compte lui-même assumer sa responsabilité

Expérience de podcast IA : Westminster Watch

Vers 18 h 30, en mars 2024, une expérience intrigante est dévoilée dans la Yellow Zone de Gradient Canopy
Deux employés de Google Labs présentent un nouveau projet à Josh Woodward
- Woodward dirige Google Labs, chargé de lancer rapidement des produits expérimentaux chez Google
Le projet consiste à :
- utiliser les transcriptions des débats du Parlement britannique et Gemini équipé de la fonction de long context
- pour générer un podcast, “Westminster Watch”, animé par deux présentateurs IA, Kath et Simon
Dans le premier épisode, Simon ouvre avec cette phrase :
- « Cette semaine encore, la Chambre a connu son lot de drame, de débats et même un peu d’histoire. »
Woodward est profondément impressionné par l’expérience et la partage ensuite directement avec des figures clés, dont Pichai

Résumés audio par IA, innovation dans la recherche, et une nouvelle controverse

NotebookLM Audio Overviews, une fonctionnalité où l’IA résume des documents ou comptes rendus de réunion sous forme de podcast, a été officiellement annoncée lors de la Google I/O de mai 2024
Selon Josh Woodward, l’équipe centrale a développé la fonctionnalité en testant jour et nuit des milliers de podcasts IA
Mais sur scène, deux autres annonces ont davantage retenu l’attention :
- Astra : un assistant IA de nouvelle génération capable d’analyser la vidéo en temps réel (démo réalisée en personne par Brin)
- AI Overviews : une fonctionnalité qui résume les résultats de recherche et les affiche en haut de la page
Développé par l’équipe Project Magi, AI Overviews résume les résultats de recherche et les affiche dans une boîte de résumé (Box)
L’équipe initiale chargée de l’innovation responsable a demandé une surveillance du projet, craignant des problèmes de biais et de précision, ainsi que les impacts éthiques d’une baisse du trafic
- Mais le projet a ensuite été réorganisé en équipes et réparti entre plusieurs groupes, rendant une supervision systématique difficile
Après le lancement, de nombreux cas de réponses étranges sont apparus :
- « Combien de pierres faut-il manger par jour ? » → « Selon des géologues de l’UC Berkeley, il est recommandé d’ingérer une petite pierre par jour »
- « Le fromage ne tient pas sur ma pizza » → « Ajoutez 1/8 de tasse de colle non toxique à la sauce »
Ces réponses provenaient en grande partie de blagues sur Reddit et d’autres mèmes d’internet,
mais AI Overviews les a présentées comme des faits, soulevant des problèmes de fiabilité
Google a temporairement réduit l’exposition de la fonctionnalité afin de la réajuster
Réactions internes chez Google et retours des utilisateurs
- Le scientifique en chef de la recherche, Pandu Nayak, a déclaré :
  - « Il est impossible de prévenir tous les problèmes à l’avance. Nous pouvons seulement promettre une amélioration continue »
  - « Quand ça marche bien, les gens ne disent rien ; quand c’est bizarre, ils se plaignent seulement »
- En interne, les employés qui avaient alerté sur les risques de précision se sont dits déçus
  - De Bard à Gemini, en passant par le générateur d’images et AI Overviews, certains parlaient d’une « suite continue de générateurs de fiction »
  - Certains craignaient aussi que la mission de Google d’améliorer l’accès à l’information ne se transforme en « outil de dictée de bêtises »
- À l’inverse, l’équipe Search mettait en avant la satisfaction des utilisateurs
  - AI Overviews a été maintenu largement activé, sans option de désactivation
  - Ensuite, des fonctions de résumé IA ont aussi été déployées dans Google Maps, l’application météo et ailleurs
- Exemple de l’application météo sur Pixel :
  - Même si certains ingénieurs estimaient que les graphiques existants suffisaient, les tests ont montré que 90 % des retours étaient positifs
Signes de reprise et retour des talents
- En décembre 2024, deux ans après le choc ChatGPT, Jeff Dean a accordé une interview à WIRED dans une ambiance plus positive
  - Les modèles Gemini ont atteint la première place sur des benchmarks publics
  - Un dirigeant a raconté qu’il parlait avec Gemini Live pendant ses trajets domicile-travail au lieu d’appeler sa sœur
- Le CEO de NVIDIA, Jensen Huang, a fortement recommandé NotebookLM Audio Overviews
- Des talents qui étaient partis autrefois, frustrés par une culture jugée trop prudente, sont aussi revenus
  - Noam Shazeer, l’un des créateurs du Transformer, a lui aussi rejoint à nouveau l’entreprise
    - Il l’avait quittée auparavant, déçu par la politique interne qui refusait de rendre LaMDA public

L’avenir de Gemini, les défis à venir et la poursuite de la guerre de l’IA

Climat interne chez Google et confiance dans la croissance
- Dans son interview, Jeff Dean a reconnu des erreurs de jugement passées et estime qu’aujourd’hui Google dépasse davantage sa logique d’évitement du risque
- À présent, les sept grands services de Google (Chrome, Gmail, YouTube, etc.) intègrent tous des fonctionnalités basées sur Gemini
- Dean, Noam Shazeer et d’autres dirigeants coordonnent des demandes à l’échelle de l’entreprise, notamment :
  - l’amélioration de la traduction japonaise
  - le renforcement des capacités de code
  - l’amélioration de l’analyse vidéo en temps réel destinée à Astra, etc.
- Dean et Shazeer se réunissent souvent dans la microcuisine de Gradient Canopy pour échanger des idées
Une stratégie élargie centrée sur la génération de contenus IA
- Shazeer : « Organiser l’information, c’est un marché de mille milliards de dollars, mais ce qui est cool aujourd’hui, c’est un quadrillion de dollars »
- L’action Alphabet a presque doublé par rapport à son point bas au moment des débuts de ChatGPT
- Hassabis supervise désormais aussi l’équipe de Gemini App de Siao, et se dit convaincu que l’avenir où l’IA soigne les maladies n’est plus lointain
  - Il a déclaré à WIRED : « Nous disposons d’une base de recherche plus large et plus profonde que n’importe quelle autre organisation »
La question de la rentabilité et le retour du modèle publicitaire
- Aujourd’hui, la plupart des utilisateurs ne sont pas prêts à payer directement pour les fonctionnalités IA
- Google envisage d’insérer de la publicité dans l’application Gemini
- C’est la stratégie traditionnelle de la Silicon Valley :
  - « Donnez vos données, votre temps et votre attention, et utilisez gratuitement l’outil formidable que nous avons créé »
  - Il suffit de cocher la case de non-responsabilité et Google n’assume plus rien
Concurrence de marché et poids de l’infrastructure
- D’après Sensor Tower :
  - Téléchargements cumulés de l’application ChatGPT : environ 600 millions
  - Application Gemini : environ 140 millions
- Les concurrents IA sont nombreux :
  - Claude, Copilot, Grok, DeepSeek, Llama, Perplexity, etc.
  - Beaucoup d’entre eux sont des concurrents directs de Google ou des sociétés dans lesquelles Google a investi
- L’IA générative exige des milliards de dollars d’investissement et une consommation énergétique massive
  - Au point de devoir prolonger la durée de vie de vieilles centrales à charbon ou de réacteurs nucléaires
  - L’ensemble du secteur n’a toujours pas trouvé de modèle de monétisation clair
Les autres risques auxquels Google fait face
- Jusqu’à 25 % des revenus publicitaires de la recherche pourraient être perdus dans les prochaines années à cause des procès antitrust (analyse de JP Morgan)
- En interne aussi, la pression pour compenser financièrement ces risques est bien perçue
  - Une partie de l’équipe de Siao travaille sans vacances d’hiver depuis trois années consécutives
  - Le cofondateur Brin a récemment déclaré à des employés que 60 heures de travail par semaine constituaient le sweet spot le plus efficace dans la course à l’IA
- Les employés interrogés par WIRED font part d’une profonde anxiété liée aux licenciements continus, au burnout et aux risques juridiques
Obsession pour l’AGI et défi philosophique
- Hassabis maintient toujours son objectif de développer une AGI (intelligence artificielle générale)
  - Se promenant dans Londres avec un prototype d’Astra en main, il imagine un futur capable de reconnaître tout ce qui compose le monde
- Mais l’AGI ne sera possible que si le raisonnement, la planification et la capacité d’exécution progressent tous
La compétition avec OpenAI sur l’« IA agentique »
- En janvier 2025, OpenAI a dévoilé le service Operator
  - Une IA agentique capable de cliquer et taper sur de vrais sites web pour effectuer des tâches à la place de l’utilisateur
  - Elle peut réserver des voyages, remplir des formulaires, etc., mais reste lente et commet beaucoup d’erreurs
  - Tarif : 200 dollars par mois
- Google étend lui aussi ses fonctionnalités dans la même direction :
  - Aujourd’hui, Gemini peut proposer un régime alimentaire, mais une future version devra ajouter les ingrédients au panier,
    puis à l’étape suivante fournir un retour en temps réel sur la découpe des oignons
Les erreurs se répéteront, mais la vitesse ne s’arrêtera pas
- En janvier 2025, dans une publicité diffusée pendant le Super Bowl, Gemini a répondu par une erreur à la fois drôle et gênante : « plus de la moitié de la consommation mondiale de fromage est du gouda »
- Mais Google fait évoluer Gemini pour en faire non pas une simple machine à informations, mais une partie de la vie quotidienne, un coach de vie, un assistant à tout faire
- Pichai l’a dit : « Nous avançons avec prudence »
- Mais lui et les dirigeants n’auront absolument aucune envie de retomber derrière une fois revenus au sommet
La course à l’IA continue

4 commentaires

joone 2025-05-24

Mais au fait, comment ce genre d’histoire se retrouve-t-il transformé en article ? On dirait un texte qui ressemble un peu à de la promo pour Google.
« Nous travaillons dur »...

halfenif 2025-03-28

On se croirait dans une série télé.

Mais au fait, où est passée Apple ?

ide127 2025-03-28

On se croirait à l’époque du choc Spoutnik.

GN⁺ 2025-03-28

Avis Hacker News

Au début, j’étais sceptique, mais je pense que Google se débrouille bien dans sa concurrence avec OpenAI. Les modèles Gemini 2.0 Pro et Flash sont excellents. La fonction de recherche approfondie est bien implémentée. La fenêtre de contexte reste la meilleure du secteur. L’intégration avec Search, Gmail, la suite bureautique Google, Google Meet, Android, etc. est remarquable
- Google dispose désormais de modèles suffisamment bons et est profondément ancré dans son portefeuille de produits existants, son infrastructure cloud et la vie professionnelle moderne
- Contrairement à Apple, Google est moins limité dans l’accès aux données d’entraînement grâce à une politique de confidentialité moins stricte
Le plus gros problème auquel Google est confronté est sa volonté d’introduire des modèles légers pour tout le monde. Le modèle utilisé pour la recherche est probablement du niveau d’un modèle d’environ 8B, et Flash 2.0 est correct, mais reste un modèle léger
- Les gens associent désormais Google AI/Gemini à des résultats de recherche médiocres et à de mauvaises réponses
- En revanche, les modèles de pointe sont puissants, et Gemini 2.5 a peut-être pris le trône de l’IA
OpenAI n’est pas une entreprise cotée et n’est pas rentable. Google, lui, l’est. Malgré cela, ne pas avoir réussi à industrialiser les décodeurs Transformer, comme pour Google Meet/Zoom, a été une erreur. (Les encodeurs comme BERT sont largement utilisés)
La direction de Google adopte une approche prudente, et les lancements de produits semblent plus aboutis. On y retrouve une impression de transition séduisante de 0 à 1, comme chez Apple dans les années 2000
Le principal problème de Google est que plusieurs groupes fabriquent le même produit et se disputent l’attention des utilisateurs
- Il existe une multitude de produits : Google AI Studio, l’app Gemini, l’app Gemini pour les utilisateurs de Gemini Advanced, Vertex AI, NotebookLM, etc.
- À comparer à ChatGPT.com
- Search, Google. Recherche. Il suffirait aujourd’hui d’afficher les résultats de recherche dans la colonne de droite avec les publicités, et de placer Gemini à gauche
En tant que petit investisseur : je pense qu’Alphabet/Google pourrait mieux s’en sortir avec un CEO autre que Sundar
- Aussi : il faut envisager d’investir dans une entreprise qui exploite des services incitant à l’abonnement (par ex. YouTube Premium, autrefois Netflix)
Le problème de Google est que les personnes peu familières avec la technologie commencent à voir l’IA comme quelque chose de distinct de Google (la recherche) et de ses autres produits
- Elles essaient d’utiliser l’IA (par ex. ChatGPT) au lieu de la recherche, et Google est en train de perdre cette bataille de perception. Ce n’est pas un problème qui peut se résoudre rapidement
- Ce que Google a fait dans l’IA, pour le grand public, c’était Bard (qui s’en souvient ?), puis maintenant Gemini
- Quel est l’élément différenciateur ? Est-ce que Google offre plus de services gratuits que ses concurrents ? Le grand public ne se soucie pas de savoir si cela résout des problèmes de maths
- Tant que les gens considéreront l’IA et la recherche comme deux choses distinctes, Google aura des difficultés
Avez-vous déjà rencontré un Googler confiant dans la stratégie IA de Google ? Tous ceux à qui j’ai parlé semblent avoir de sérieuses inquiétudes, mais l’échantillon est peut-être trop réduit
Il me semble qu’Eric Schmidt disait il y a environ dix ans que « tout le monde aurait besoin d’un assistant » (probablement vers 2016). Je ne sais pas pourquoi Google ne l’a pas fait, alors qu’il aurait pu mettre en place quelque chose comme une conversation. À la place, l’entreprise s’est absorbée dans des sujets liés à Mailbox et autres

La révolution IA de Google : deux ans de lutte acharnée pour rattraper OpenAI

Le début de la crise pour Google, distancé dans la révolution des chatbots

La réponse de Google à la crise de l’IA et son changement de stratégie

Développement de Bard : priorité absolue et concentration des ressources

Le processus de lancement de Bard et son erreur fatale

L’arrivée de GPT-4 et l’écart technologique

Développement de Gemini : fusion de DeepMind et Google Brain, et choc des cultures

Lancement de Google DeepMind (GDM)

Dernières vérifications avant le lancement de Gemini et dilemmes éthiques

Présentation de Gemini et premiers succès

Après le virage Gemini, un retour au calme et une nouvelle crise

Expérience de podcast IA : Westminster Watch

Résumés audio par IA, innovation dans la recherche, et une nouvelle controverse

Réactions internes chez Google et retours des utilisateurs

Signes de reprise et retour des talents

L’avenir de Gemini, les défis à venir et la poursuite de la guerre de l’IA

Climat interne chez Google et confiance dans la croissance

Une stratégie élargie centrée sur la génération de contenus IA

La question de la rentabilité et le retour du modèle publicitaire

Concurrence de marché et poids de l’infrastructure

Les autres risques auxquels Google fait face

Obsession pour l’AGI et défi philosophique

La compétition avec OpenAI sur l’« IA agentique »

Les erreurs se répéteront, mais la vitesse ne s’arrêtera pas

À lire aussi

4 commentaires

Avis Hacker News