27 points par xguru 2025-06-02 | 1 commentaires | Partager sur WhatsApp
  • Le rapport Trends de Mary Meeker, publié pour la première fois depuis 5 ans. Cette fois, l’IA est au centre. Total : 340 pages
  • L’usage et la diffusion de l’IA progressent bien plus vite que ceux d’Internet, et le moment où les machines dépassent les humains est en train d’arriver
  • Cette dynamique est portée par l’infrastructure Internet mondiale (5,5 milliards d’utilisateurs), plus de 30 ans d’accumulation de datasets numériques, ainsi que par l’émergence des grands modèles de langage (LLM) menés par ChatGPT et les innovations en matière d’utilisabilité et de vitesse
  • Les jeunes entreprises de l’IA avancent de manière très agressive en matière d’innovation, d’investissement, de lancement produit et de levées de capitaux, tandis que les grands groupes tech historiques accélèrent eux aussi leurs investissements centrés sur l’IA et leur croissance
  • La concurrence entre la Chine et les États-Unis dans l’IA, entre autres luttes mondiales pour la suprématie technologique, s’intensifie fortement, et ce rapport espère contribuer au débat sur les transformations technologiques, financières, sociales, physiques et géopolitiques

Plan du document

  1. Le changement se produit-il plus vite qu’auparavant ?
    → Oui, et il accélère réellement
  2. Croissance des utilisateurs IA + de l’usage + des dépenses d’investissement (CapEx) =
    → Une croissance sans précédent (Unprecedented)
  3. Les coûts de compute des modèles d’IA augmentent, tandis que les coûts d’inférence baissent =
    → Convergence des performances (Performance Converging), hausse de l’usage chez les développeurs (Developer Usage)
  4. Croissance de l’usage (Usage) + des coûts (Cost) + des pertes (Loss) de l’IA =
    → Un niveau sans précédent (Unprecedented)
  5. Les menaces sur la monétisation (Monetization) de l’IA =
    → Intensification de la concurrence, dynamique de l’open source (expansion de son influence), montée de la Chine
  6. Fusion du monde physique et de l’IA (Ramps) =
    → Rapide et guidée par les données (Fast + Data-Driven)
  7. Hausse des utilisateurs mondiaux d’Internet stimulée par l’IA =
    → Une croissance jamais connue jusque-là
  8. Évolution (Evolution) de l’IA et du travail (Work) =
    → Bien réelle et très rapide (Real + Rapid)

Vue d’ensemble

  • Dire que « le monde change à une vitesse sans précédent » est presque en deçà de la réalité, tant la vitesse et l’ampleur des transformations s’étendent brutalement
  • L’innovation technologique, l’adoption rapide et les changements de leadership mondial constituent les fondements (Underpinnings) de l’ensemble de ces transformations
  • Mission fondatrice de Google (1998) : « organiser l’information mondiale et la rendre universellement accessible et utile »
  • Mission fondatrice d’Alibaba (1999) : « permettre de faire des affaires facilement partout »
  • Mission fondatrice de Facebook (2004) : « donner aux gens le pouvoir de partager davantage et de rendre le monde plus ouvert et plus connecté »
  • Aujourd’hui, la combinaison de l’IA (Artificial Intelligence), de la puissance de calcul accélérée (Computing Power) et du capital sans frontières (Borderless Capital) améliore spectaculairement l’organisation de l’information, la connexion et l’accessibilité, et entraîne de profondes transformations
  • De la même manière que les performances des athlètes progressent sans cesse grâce aux données / aux entrées / à l’entraînement, les entreprises deviennent elles aussi de plus en plus intelligentes et compétitives à mesure que les ordinateurs apprennent sur d’immenses datasets
  • Les innovations autour des grands modèles (Large Models), la baisse du coût par token (cost-per-token), la prolifération de l’open source (Open-Source Proliferation) et l’amélioration des performances des puces (Chip Performance) augmentent de façon spectaculaire à la fois l’économie, la puissance et l’accessibilité de la technologie
  • ChatGPT d’OpenAI est le cas de « succès du jour au lendemain (overnight success) » le plus rapide de l’histoire en matière d’utilisateurs, d’usage et d’indicateurs de monétisation (atteint 9 ans après la création de l’entreprise)
  • L’usage de l’IA explose chez les consommateurs, développeurs, entreprises et gouvernements
  • Lors de la révolution Internet 1.0, la technologie était née aux États-Unis puis s’était diffusée progressivement, mais ChatGPT a été adopté simultanément dans le monde entier et a connu une croissance rapide
  • Les grands acteurs de plateforme historiques (incumbents) et les nouveaux challengers se disputent la maîtrise de nouvelles couches de l’infrastructure IA comme les agentic interfaces, les enterprise copilots, les real-world autonomous systems ou les sovereign models
  • Les avancées radicales de l’IA, de l’infrastructure de calcul et de la connectivité mondiale (global connectivity) reconfigurent en profondeur, à l’échelle des entreprises comme des États, la manière de travailler (Work), le déploiement du capital (Capital Deployment) et les critères mêmes du leadership
  • En parallèle, un basculement du leadership mondial est en cours, et les grandes puissances cherchent activement à contenir la compétitivité et les avantages comparatifs de leurs rivales
  • Partout dans le monde, les pays réaccélèrent en fonction de leurs ambitions économiques, sociales et territoriales (Economic / Societal / Territorial Aspiration)
  • Désormais, deux forces immenses, la technologie (Technological) et la géopolitique (Geopolitical), s’entremêlent de plus en plus profondément
  • Le CTO de Meta Platforms, Andrew Bosworth, a récemment déclaré dans le podcast « Possible » que « l’IA aujourd’hui ressemble à une course à l’espace (Space Race), et les grands pays, notamment la Chine, disposent de capacités très élevées ; il y a très peu de secrets et tout le monde progresse constamment »
  • Le leadership dans l’IA (AI Leadership) peut déboucher sur un leadership géopolitique (Geopolitical Leadership) (l’inverse n’est pas vrai)
  • Ce phénomène s’accompagne d’une forte incertitude (Uncertainty), mais comme l’a dit l’ancien président de T. Rowe Price, Brian Rogers, « statistiquement, le monde ne s’arrête pas si souvent que ça », d’où l’importance de garder une vision optimiste
  • Du point de vue de l’investisseur, on suppose toujours que tout peut mal tourner, mais l’attente de ce qui peut réellement bien se passer est la véritable source de l’optimisme (Optimism)
  • Le fait que l’IA fasse le travail à notre place rappelle la magie des débuts de l’email et de la recherche web, avec des effets meilleurs / plus rapides / moins chers (Better / Faster / Cheaper) qui se diffusent bien plus rapidement
  • Bien sûr, les risques (Danger) et les incertitudes sont grands, mais à long terme, on peut espérer que la concurrence forte (Competition), l’innovation (Innovation), un compute bon marché et accessible (Accessible Compute), des technologies IA qui se diffusent vite, ainsi qu’un leadership prudent et méthodique (Thoughtful and Calculated Leadership), produisent un équilibre comparable à la destruction mutuelle assurée (Mutually Assured Deterrence)
  • Pour certains, l’évolution de l’IA peut devenir une course vers le bas (Race to the Bottom), mais pour d’autres, elle marque le début d’une course vers le sommet (Race to the Top)
  • Les forces spéculatives et dynamiques du capitalisme (Capitalism) et de la destruction créatrice (Creative Destruction) provoquent un gigantesque bouleversement tectonique
  • En particulier, la concurrence féroce entre les États-Unis (USA), la Chine (China) et les leaders mondiaux de la tech est déjà en mode « game on »
  • Ce rapport vise à montrer de manière multidimensionnelle les tendances de cette période dynamique (Dynamic Time) en s’appuyant sur diverses données, recherches et benchmarks tiers
  • Son objectif ultime est de contribuer à cette discussion

1. Le changement se produit-il plus vite qu’auparavant ?

Croissance composée de la technologie = les chiffres derrière l’élan

« La croissance composée de la technologie = les chiffres et les données cachés derrière la dynamique de croissance explosive »

  • Histoire des cycles informatiques et avènement de l’ère de l’IA
    • Années 1960 : mainframe (Mainframe, ~1 million d’unités) → minicomputer (Minicomputer, ~10 millions d’unités) → PC (~300 millions d’unités) → internet sur ordinateur de bureau (Desktop Internet, ~1 milliard d’utilisateurs) → internet mobile (Mobile Internet, ~4 milliards) → ère de l’IA (AI Era, de plusieurs milliards à plusieurs dizaines de milliards)
    • L’infrastructure informatique accumulée (CPU, GPU, cloud / big data) est devenue la base de la diffusion de l’IA
    • À l’ère des appareils IA, on s’attend à un nombre d’appareils des dizaines de milliers à des centaines de milliers de fois supérieur à celui des mainframes du passé
  • Croissance des jeux de données d’entraînement des modèles d’IA (nombre de mots)
    • Entre 1950 et 2025, la taille des jeux de données d’entraînement des principaux modèles d’IA (en nombre de mots) a augmenté de 260 % par an en moyenne
    • Depuis 2018, l’apparition de grands modèles comme GPT-2, GPT-3 et GNMT a entraîné une hausse exponentielle de l’usage des données
    • Les modèles récents, comme Aramco Metabrain AI, sont entraînés sur des dizaines de milliers de milliards de mots
  • Croissance du compute utilisé pour l’entraînement des modèles d’IA (volume de calcul, FLOP)
    • Entre 1950 et 2025, le volume de calcul d’entraînement des principaux modèles d’IA a augmenté de 360 % par an en moyenne
    • Avec l’émergence de grands modèles comme GPT-4, Grok, AlphaGo et Swift, les indicateurs de FLOP ont fortement grimpé
  • Les gains d’efficacité du compute apportés par l’innovation algorithmique
    • Entre 2014 et 2023, le compute effectif (Effective Compute) des modèles d’IA a augmenté de 200 % par an en moyenne
    • Des optimisations algorithmiques comme Chinchilla et OPT-175B ont fortement contribué à l’amélioration des performances et à la réduction du compute
  • Croissance des performances des supercalculateurs IA
    • Entre 2019 et 2025, les performances des supercalculateurs IA (clusters) ont augmenté de 150 % par an en moyenne
    • Sunway OceanLight, clusters GPT-3/4, Frontier, El Capitan, xAI Colossus, etc.
    • Croissance simultanée des performances des puces et du nombre de puces par cluster
  • Explosion du nombre de grands modèles d’IA puissants
    • Entre 2017 et 2024, hausse annuelle de 167 % : le nombre de grands modèles d’IA de plus de 10^23 FLOP lancés a fortement augmenté
    • DeepMind (AlphaGo), xAI, Anthropic, Meta, NVIDIA, Mistral et d’autres acteurs se sont multipliés
  • Croissance des utilisateurs, abonnés et revenus de ChatGPT
    • Entre 10.2022 et 4.2025, les utilisateurs actifs hebdomadaires (Users, MM), abonnés (Subscriber, MM) et revenus (Revenue, $B) ont tous connu une croissance exponentielle
    • Plus de 800 millions d’utilisateurs hebdomadaires, plus de 20 millions d’abonnés, et un chiffre d’affaires annuel proche de 4 milliards de dollars
  • Vitesse d’atteinte de 365 milliards de recherches annuelles : ChatGPT vs Google
    • ChatGPT : 365 milliards de recherches annuelles atteints en 2 ans (2024)
    • Google : 11 ans nécessaires pour atteindre le même chiffre (2009)
    • ChatGPT a affiché une vitesse de diffusion 5,5 fois plus rapide que Google
  • En 1998, au début de la démocratisation d’internet, Google s’est lancé avec l’objectif « d’organiser l’information mondiale pour la rendre universellement accessible et utile »
  • En près de 30 ans, au rythme de changement le plus rapide jamais connu par l’humanité, la plupart des informations sont désormais numérisées, accessibles et exploitables
  • L’évolution de l’accès à l’information et des modes de circulation via l’IA progresse à un rythme encore bien plus rapide
  • L’IA est un Compounder (un moteur de croissance composée) construit sur l’infrastructure d’internet,
    qui permet à des services faciles à utiliser et capables de capter l’intérêt du grand public de se diffuser à une vitesse extrême

Évolution de la diffusion du savoir (Knowledge Distribution Evolution)

  • 1440~1992 : Static + Physical Delivery
    • De l’invention de l’imprimerie (Printing Press) en 1440 à 1992, le savoir a été diffusé de manière statique (Static) et physique (Physical)
    • Autrement dit, une structure de transmission du savoir centrée sur les imprimés — livres, journaux, magazines — est restée en place pendant des siècles
      – 1993~2021 : Active + Digital Delivery
    • Depuis la mise à disposition du World Wide Web en 1993, on est passé à une diffusion du savoir active (Active) et fondée sur le numérique (Digital)
    • Chacun a pu créer un site web, accéder à l’information en temps réel et la faire circuler
    • Internet a provoqué une transformation fondamentale dans « l’ouverture et la circulation du savoir »
      – 2022+ : Active + Digital + Generative Delivery
    • Avec le lancement de ChatGPT en 2022, nous sommes entrés dans l’ère de la diffusion du savoir fondée sur l’IA générative
      • Generative AI : une IA capable de générer différents types de contenus, comme du texte, des images, de l’audio ou du code
      • ChatGPT a établi un record historique de croissance en franchissant le cap du million d’utilisateurs en 5 jours seulement après son lancement
    • Désormais, le savoir n’est plus seulement stocké et recherché : c’est une époque où l’IA le génère de manière créative et le délivre instantanément

« Le savoir est l’accumulation des faits (wisdom), mais la sagesse réside dans leur simplification » – Martin H. Fischer

  • IA = Many Years Before Lift-Off
    • La technologie IA peut sembler avoir connu une croissance explosive en peu de temps, mais des décennies de préparation et de développement ont précédé sa véritable démocratisation
  • Frise chronologique des jalons de l’IA 1950~2025 (compilée par Stanford)
    • 10.1950 : Alan Turing présente le test de Turing (proposition d’un concept d’évaluation de l’intelligence des ordinateurs)
    • 6.1956 : tenue de la Dartmouth Conference, où John McCarthy forge le terme « Artificial Intelligence »
    • 1.1962 : Arthur Samuel d’IBM bat le champion des États-Unis aux dames avec un programme auto-apprenant
    • 1.1966 : déploiement de Shakey à Stanford, premier robot mobile généraliste
    • 1967~1996 : « AI Winter » – recul des investissements et de l’intérêt faute de progrès majeurs
    • 5.1997 : IBM Deep Blue bat le champion du monde d’échecs Kasparov
    • 9.2002 : lancement de Roomba, premier aspirateur robot produit en masse
    • 10.2005 : Stanley, la voiture autonome de Stanford, termine le DARPA Grand Challenge
    • 4.2010 : Apple rachète Siri puis l’intègre à l’iPhone 4S
    • 6.2014 : le chatbot Eugene Goostman réussit le test de Turing
    • 6.2018 : OpenAI présente GPT-1, le premier grand modèle de langage
    • 6.2020 : OpenAI lance GPT-3 et Microsoft obtient une licence exclusive
    • 11.2022 : OpenAI ouvre ChatGPT au grand public
    • 3.2023 : OpenAI lance GPT-4 (multimodal) / Microsoft intègre Copilot / Google lance Bard / Anthropic lance Claude
    • 11.2023 : 28 pays, dont les États-Unis, l’UE et la Chine, signent la déclaration de Bletchley sur la sécurité de l’IA
    • 3~5.2024 : Meta publie Llama 3 (open source) / feuille de route IA du Department of Homeland Security américain / Google introduit des fonctions de recherche basées sur l’IA / OpenAI lance GPT-4o (entièrement multimodal)
    • 7.2024 : Apple annonce Apple Intelligence (pour les développeurs)
    • 9.2024 : Alibaba lance 100 modèles open source Qwen 2.5 (performances comparables à celles de l’Occident)
    • 12.2024 : OpenAI annonce o3 (modèle aux meilleures performances)
    • 1.2025 : DeepSeek publie les modèles de raisonnement open source R1 et R1-Zero / Alibaba annonce Qwen2.5-Max (surpasse GPT-4o et Claude 3.5 en raisonnement)
    • 2.2025 : OpenAI lance GPT-4.5 / Anthropic annonce Claude 3.7 Sonnet / xAI lance Grok 3
    • 4.2025 : ChatGPT atteint 800 millions d’utilisateurs hebdomadaires

Vers le T2 2025 - Dix choses que l’IA peut faire aujourd’hui (selon ChatGPT)

  1. Rédiger ou éditer n’importe quoi : e-mails, dissertations, contrats, poèmes, code, etc., avec instantanéité et fluidité
  2. Résumer et expliquer des documents complexes : simplifier des PDF, documents juridiques, recherches et du code, puis les reformuler en anglais courant
  3. Servir de tuteur sur presque tous les sujets : soutien pas à pas en mathématiques, histoire, langues, préparation aux examens, etc.
  4. Devenir un partenaire de réflexion : aide à la réflexion pour le brainstorming d’idées, le débogage logique, la vérification d’hypothèses, etc.
  5. Automatiser les tâches répétitives : génération de rapports, organisation de données, synthèse de slides, réécriture de texte, etc.
  6. Jouer le rôle nécessaire : préparation d’entretiens, simulation de clients, répétition de conversations, etc.
  7. Connexion aux outils : rédaction de code d’intégration avec divers outils comme des API, des feuilles de calcul, des calendriers et du code web
  8. Assurer un soutien psychologique et un rôle de compagnon : parler de sa journée, reformuler ses pensées ou simplement écouter
  9. Aider à trouver un but dans la vie : clarification des valeurs, définition d’objectifs, élaboration de plans d’action, etc.
  10. Organiser la vie : planification de voyages, conception de routines, structuration d’une semaine ou d’un flux de travail, etc.

Vers 2030 ? - 10 choses que l’IA devrait pouvoir faire dans les 5 prochaines années (selon ChatGPT)

  1. Générer du texte, du code et du raisonnement au niveau humain : produire des résultats comparables à ceux d’un humain dans les chatbots, l’ingénierie logicielle, les plans d’affaires, l’analyse juridique, etc.
  2. Créer à plein temps des films et des jeux : production automatisée de contenus complets, incluant scénarios, personnages, scènes, mécaniques de gameplay et voice acting
  3. Comprendre et parler comme un humain : assistants capables de reconnaître les émotions, agents vocaux multilingues en temps réel, etc.
  4. Jouer le rôle d’assistant personnel avancé : planification de vie, rappel de souvenirs, synchronisation des calendriers et informations entre toutes les apps et appareils, etc.
  5. Faire fonctionner des robots humanoïdes : aide ménagère, prise en charge des personnes âgées, automatisation du retail et de l’hospitality, etc.
  6. Gérer de manière autonome le service client et les ventes : résolution de problèmes end-to-end, upselling, intégration CRM, support 24/7, etc.
  7. Personnaliser l’ensemble de la vie numérique d’un individu : apprentissage adaptatif, recommandations de contenu dynamiques, santé personnalisée, etc.
  8. Créer et exploiter des entreprises autonomes : startups fondées sur l’IA, optimisation des stocks et des prix, opérations entièrement numériques, etc.
  9. Automatiser la découverte scientifique : conception de médicaments, synthèse de nouveaux matériaux, modélisation climatique, test de nouvelles hypothèses, etc.
  10. Collaborer de manière créative comme un partenaire : coécriture de romans, production musicale, design de mode, architecture et autres formes de création collaborative

Vers 2035 ? - 10 choses que l’IA devrait pouvoir faire dans les 10 prochaines années (selon ChatGPT)

  1. Mener des recherches scientifiques : génération d’hypothèses, exécution de simulations, conception et analyse d’expériences, etc.
  2. Concevoir des technologies de pointe : découverte de nouveaux matériaux, conception biotech, prototypage de systèmes énergétiques, etc.
  3. Simuler des esprits semblables à ceux des humains : création de personas numériques dotés de mémoire, d’émotions et de comportements adaptatifs
  4. Exploiter des entreprises de manière autonome : gestion de la R&D, des finances, de la logistique, etc., avec une intervention humaine minimale
  5. Exécuter des tâches physiques complexes : manipulation d’outils, assemblage de composants, adaptation à des environnements réels, etc.
  6. Coordonner des systèmes mondiaux : optimisation à grande échelle de la logistique, de l’usage de l’énergie et de la réponse aux crises
  7. Modéliser des systèmes biologiques : simulation de cellules, de gènes et d’organismes, avec des applications thérapeutiques et de recherche
  8. Fournir une prise de décision de niveau expert : conseil juridique, médical et business en temps réel
  9. Participer au débat public et à l’élaboration des politiques : modération de forums, proposition de lois, arbitrage entre parties prenantes, etc.
  10. Construire des mondes virtuels immersifs : génération d’environnements 3D interactifs à partir de simples prompts textuels

La vitesse de développement de l’IA dépasse les prévisions

  • Évolution des acteurs du développement des modèles de machine learning (2003~2024)
    • De 2003 à 2014, c’est le monde académique (academia) qui a dominé le développement des modèles de machine learning (Academia Era)
    • Depuis 2015, l’industrie (industry) a très largement dépassé le monde académique en données, capacité de calcul et capitaux investis, et mène désormais l’innovation (Industry Era)
    • En 2024, environ 60 modèles de ML remarquables sont développés chaque année dans l’industrie
  • Forte hausse du nombre de développeurs IA (écosystème NVIDIA, 2005~2025)
    • Le nombre de développeurs mondiaux dans l’écosystème NVIDIA a été multiplié par 6 en 7 ans (avec une projection à 6 millions en 2025)
    • La croissance la plus forte s’est produite entre 2018 et 2025
  • Nombre de développeurs dans l’écosystème IA de Google (2024~2025)
    • Mai 2024 : 1,4 million → mai 2025 : 7 millions
    • Croissance multipliée par 5 en un an, avec une expansion explosive de la communauté de développeurs IA autour de la plateforme Gemini
  • Explosion du nombre de brevets américains liés au computing (1960~2024)
    • Après l’IPO de Netscape en 2003, +6 300 en 8 ans, puis seulement +1 000 sur 18 ans entre 2004 et 2022
    • Après le lancement de ChatGPT (2022), +6 000 en seulement un an
    • Les brevets d’innovation liés aux technologies de computing/IA affluent à grande échelle
  • Les performances de l’IA ont dépassé le niveau humain en 2024
    • Sur le benchmark MMLU (culture générale + raisonnement), les systèmes d’IA ont atteint en 2024 une précision de 92,3 %, dépassant l’humain (89,8 %)
  • Capacité de l’IA à être perçue comme humaine (T1 2025)
    • GPT-4o (sans persona) : 73 % des réponses ont été prises à tort pour des réponses humaines
    • GPT-4.5 (avec persona) : plus de 90 % d’échec dans l’identification comme IA (les gens ne se rendaient pas compte qu’il s’agissait d’une IA)
    • Le caractère humain et le réalisme des réponses de l’IA se sont spectaculairement améliorés
  • Réalisme des conversations avec l’IA (cas de test de Turing)
    • Exemple réel de conversation dans un test de Turing utilisant GPT-4.5
    • 87 % des participants à l’expérience ont pris pour humain le participant A, qui était en réalité une IA,
      tandis que l’humain (B) a au contraire été jugé comme ayant une « vibe d’IA »
    • La capacité de conversation naturelle de l’IA moderne dépasse celle des humains
  • Évolution des performances en génération d’images par IA
    • Comparaison entre Midjourney v1 (2022) et v7 (2025) :
      en 3 ans, le rendu de bijoux (collier tournesol) est devenu d’un réalisme saisissant
  • Images générées par IA vs images réelles (2024)
    • En 2024, les portraits générés par IA (StyleGAN2) sont devenus si sophistiqués qu’ils sont presque impossibles à distinguer de vraies photos
    • Le réalisme des images générées a bondi
  • Réalisme de la génération/traduction vocale par IA (cas ElevenLabs)
    • L’outil de génération vocale par IA d’ElevenLabs offre
      • doublage vocal automatique, traduction multilingue en temps réel, préservation de la voix d’origine, etc., avec un niveau avancé
      • le trafic mondial du site a dépassé 20 millions de visites mensuelles en 2 ans, et 60 % des entreprises du Fortune 500 l’ont adopté
    • La génération et la traduction audio par IA progressent elles aussi à un rythme explosif
  • Popularisation de la traduction audio basée sur l’IA (Spotify, mai 2025)
    • Spotify a commencé à accepter la traduction IA de livres audio en 29 langues en partenariat avec ElevenLabs
    • Vision avancée : « une époque où chacun crée des contenus dans sa langue, et où l’IA les traduit en temps réel pour les diffuser dans le monde entier » (CEO Daniel Ek)
    • Au premier trimestre 2025 : 678 millions d’utilisateurs actifs mensuels, 268 millions d’abonnés, 16,8 milliards d’euros de chiffre d’affaires annuel
  • Accélération des performances de l’IA : nouveaux cas d’usage (novembre 2024, Morgan Stanley)
    • Protein Folding : DeepMind AlphaFold, prédiction de la structure de presque toutes les protéines
    • Cancer Detection : Microsoft & Paige, création du plus grand modèle mondial de détection du cancer fondé sur l’image
    • Robotics : Google, démonstration de robots comprenant et exécutant des consignes humaines à l’aide de LLM
    • Agentic AI : Amazon, présentation d’un outil qui exécute des tâches selon les instructions de l’utilisateur
    • Universal Translation : Meta, présentation d’un modèle d’IA multimodal de traduction et d’interprétation multilingue
    • Digital Video Creation : Channel 1 AI, démonstration de création de vidéos d’actualité personnalisées basées sur la GenAI

Les bénéfices et les risques de l’IA (Benefits & Risks)

  • Les avantages du développement de l’IA (benefits)
    • Tous les accomplissements de la civilisation humaine sont le produit de l’intelligence humaine, et plus le niveau de machine intelligence s’élève, plus l’ambition de l’humanité s’étend considérablement
    • L’IA et les robots pourraient libérer l’humanité du travail répétitif et ouvrir une ère de paix et de prospérité grâce aux gains de productivité
    • L’accélération de la recherche scientifique peut aider à résoudre plus vite les maladies, le changement climatique et les problèmes de ressources
  • Les risques du développement de l’IA (risks)
    • Demis Hassabis (Google DeepMind) : « Il faut d’abord résoudre l’IA pour pouvoir résoudre tout le reste. Mais avant d’en avoir l’occasion, des mésusages et des risques non intentionnels liés à l’IA peuvent survenir »
    • Risques déjà visibles et appelés à s’amplifier : lethal autonomous weapons, surveillance, prise de décision biaisée (biased decision making), impact sur l’emploi (employment impact), sécurité et sûreté (safety-critical applications, cybersecurity), etc.

« Le succès du développement de l’IA pourrait être le plus grand événement de l’histoire de la civilisation humaine, mais il pourrait aussi être le dernier si nous n’apprenons pas à éviter ses risques » - Stephen Hawking

AI User + Usage + CapEx Growth = Unprecedented

  • En 17 mois, ChatGPT a dépassé les 800 millions d’utilisateurs actifs hebdomadaires (+8x)
  • La vitesse d’adoption mondiale de l’IA (Global Adoption) est elle aussi sans précédent par rapport aux débuts d’Internet (90 % d’utilisateurs hors Amérique du Nord atteints en 3 ans, contre 23 ans pour Internet)
  • ChatGPT a atteint 100 millions d’utilisateurs en 0,2 an (environ 2 mois), une croissance très supérieure à celle des grands services Internet comme TikTok, Instagram ou YouTube
  • Délai pour atteindre 1 million d’utilisateurs (clients) : Ford Model T : 2 500 jours, iPhone : 74 jours, ChatGPT : 5 jours — avec en plus un coût d’accès de 0 $, au plus haut en matière d’accessibilité
  • Aux États-Unis, il faudrait 3 ans pour que 50 % des foyers utilisent l’IA, contre 6 ans pour l’Internet mobile, 12 ans pour le desktop, 20 ans pour le PC et 42 ans pour la révolution industrielle, soit deux fois plus rapide
  • La vitesse d’adoption et de diffusion de l’IA est plus rapide que celle de toute autre technologie dans l’histoire, et l’ampleur comme l’étendue de son impact dépassent elles aussi les prévisions

L’adoption de l’IA par les entreprises tech, priorité absolue

  • Les Big Tech et les grandes entreprises technologiques concentrent leurs efforts sur l’IA comme enjeu central de management
    • NVIDIA, Google, Microsoft, Meta, Amazon, Baidu, IBM, C3.ai, etc.
    • Entre 2020 et 2024, la fréquence des mentions de l’IA dans les publications de résultats a fortement augmenté, marquant le début d’une concurrence pleinement centrée sur l’IA
  • Amazon (CEO Andy Jassy)
    • « L’IA générative va transformer presque toutes les expériences client »
    • Adoption et gains d’efficacité de l’IA dans tous les domaines : code, recherche, shopping, finance, santé, robotique, bio, etc.
  • Google (CEO Sundar Pichai)
    • « L’IA est le moyen le plus important de faire progresser notre mission (organiser l’information et la rendre universellement accessible) »
    • « L’opportunité de l’IA est d’une tout autre dimension que tout ce que nous avons connu jusqu’ici »
  • Duolingo (CEO Luis von Ahn)
    • « L’IA générative contribue à la génération de données, à de nouvelles fonctionnalités et à l’efficacité à l’échelle de toute l’entreprise »
    • Même le curriculum d’échecs a été prototypé uniquement avec l’IA
  • xAI (CEO Elon Musk)
    • « L’essence de Grok AI est la recherche de la vérité (truth-seeking), indispensable à la sécurité de l’IA »
    • « Il faut créer une IA aussi orientée vers la vérité que possible »
  • Roblox (CEO David Baszucki)
    • « L’IA est un outil d’accélération qui maximise les capacités individuelles ; à l’avenir, chacun disposera de sa propre IA »
  • NVIDIA (CEO Jensen Huang)
    • « D’ici dix ans, l’IA deviendra l’infrastructure de toutes les industries, de tous les pays et de toutes les entreprises »
    • « Les data centers IA sont fondamentalement des “AI factories”, qui produisent une valeur immense »
  • Les leaders mondiaux de la tech jouent leur avenir sur l’adoption de l’IA et l’extension des infrastructures, en soulignant d’une seule voix que l’IA est au cœur de la compétitivité future des entreprises et des sociétés

L’adoption de l’IA par les entreprises traditionnelles grimpe aussi rapidement dans les priorités

  • Forte hausse de l’intérêt pour l’IA parmi les entreprises du S&P 500
    • Au 4e trimestre 2024, 50 % des entreprises du S&P 500 ont mentionné “AI” dans leurs publications de résultats, en forte hausse par rapport à 2015
    • L’IA s’impose comme agenda stratégique central dans l’ensemble des entreprises
  • Pour les grands groupes mondiaux, l’objectif de l’adoption de l’IA est la « croissance du chiffre d’affaires »
    • Au cours des deux prochaines années, la majorité des objectifs d’investissement dans l’IA générative (GenAI) se concentrent sur la productivité, le service client, le chiffre d’affaires et l’efficacité marketing, autrement dit sur la « croissance et la rentabilité »
    • La réduction des coûts (cost reduction) reste une priorité relativement secondaire
  • 75 % des CMO mondiaux expérimentent ou adoptent des outils d’IA
    • La plupart des organisations marketing mènent des tests initiaux ou des pilotes, et une part importante a déjà pleinement adopté l’IA
  • Exemples concrets d’adoption
    • Bank of America: Erica Virtual Assistant
      • 40 millions de clients, 2,5 milliards d’interactions cumulées, plus de 50 000 mises à jour de performance
      • S’est imposé comme assistant financier numérique disponible 24/7
    • JP Morgan: modernisation IA de bout en bout
      • Grâce à l’adoption de l’IA/ML, des gains attendus de +35 à +65 % en revenus et en efficacité entre 2023 et 2025
    • Kaiser Permanente: dossiers médicaux basés sur l’IA (AI Scribe)
      • Déployés auprès de milliers de soignants, avec réduction de la charge documentaire, amélioration de l’expérience patient et de la qualité des soins
    • Yum! Brands: Byte by Yum!
      • En 2025, déploiement de systèmes de commande et d’exploitation basés sur l’IA dans 25 000 restaurants
  • Les grandes entreprises traditionnelles font elles aussi de l’adoption de l’IA une priorité stratégique orientée vers la croissance et l’innovation, et non vers la seule réduction des coûts
    • Des cas concrets de réussite de l’usage de l’IA s’accumulent rapidement dans chaque secteur

L’adoption de l’IA dans l’éducation, l’administration et la recherche grimpe elle aussi dans les priorités

  • Exemples d’intégration de l’IA dans l’éducation (établissements d’enseignement)
    • Arizona State University : création d’une organisation dédiée au développement d’outils d’IA (« AI Acceleration »)
    • Partenariat Oxford-OpenAI : coopération sur cinq ans pour renforcer la recherche et la culture IA
    • NextGenAI : lancement d’un consortium de 50 millions de dollars réunissant 15 universités de recherche, dont le MIT, Harvard et Caltech
    • ChatGPT Gov : lancement d’un ChatGPT réservé aux agences du gouvernement fédéral américain (janvier 2025)
    • Laboratoires nationaux américains : coopération sur les infrastructures IA pour le nucléaire, la cybersécurité et les sciences avancées
  • Extension des politiques publiques d’adoption de l’IA (Sovereign AI)
    • NVIDIA Sovereign AI Partners : accélération de la construction d’infrastructures IA nationales en France, en Suisse, en Espagne, en Équateur, au Japon, au Vietnam, à Singapour, etc.
    • « La manière dont chaque pays investit dans l’infrastructure IA rappelle les infrastructures électriques et Internet d’autrefois » (CEO de NVIDIA, Jensen Huang)
  • Extension de l’application de l’IA à la recherche (R&D) et à la santé
    • Dispositifs médicaux d’IA approuvés par la FDA : 223 approbations annuelles en 2023, en hausse explosive par rapport à 2015 (budget IA du gouvernement fédéral américain sur FY21~FY25 : 14,7 milliards de dollars)
    • Découverte de médicaments basée sur l’IA : réduction de 30 à 80 % du temps nécessaire pour atteindre la phase préclinique (Pre-Clinical) par rapport aux méthodes traditionnelles, soit une accélération de 1,5x à 12x
  • Dans les secteurs non lucratifs et publics comme l’éducation, l’administration, la recherche et la santé, l’adoption et l’intégration de l’IA se diffusent rapidement
    • Grâce aux investissements d’infrastructure, à l’assouplissement réglementaire et à la recherche collaborative, le rythme de l’innovation IA hors du seul secteur industriel s’accélère lui aussi

AI User + Usage + CapEx Growth = Unprecedented

  • État de l’adoption de ChatGPT chez les adultes américains
    • La part des adultes américains ayant déjà utilisé ChatGPT a fortement augmenté, passant de 18 % en juillet 2023 à 37 % en janvier 2025
    • Elle atteint 55 % chez les 18-29 ans et 44 % chez les 30-49 ans, montrant un usage plus élevé chez les populations les plus jeunes
    • Le CEO d’OpenAI, Sam Altman, estime que « les jeunes l’utilisent comme conseiller de vie, tandis que les plus âgés s’en servent comme substitut à la recherche »
  • Hausse du temps d’utilisation quotidien moyen de l’app ChatGPT
    • Entre juillet 2023 et avril 2025, le temps d’utilisation quotidien moyen a augmenté de 202 % chez les utilisateurs américains de l’app ChatGPT
    • Il est passé d’environ 7 minutes à près de 20 minutes par jour, signe d’une forte hausse de l’engagement envers les apps d’IA
  • Hausse du nombre de sessions et du temps par session sur l’app ChatGPT
    • Entre juillet 2023 et avril 2025, le nombre moyen de sessions a progressé de 106 %, et le temps par session a aussi augmenté de 47 %
    • Les utilisateurs emploient l’app plus souvent et plus longtemps, preuve que les outils d’IA s’installent dans le quotidien
  • Comparaison du taux de rétention hebdomadaire entre ChatGPT et Google Search
    • Entre janvier 2023 et avril 2025, le taux de rétention hebdomadaire de ChatGPT atteint 80 %, loin devant les 58 % de Google Search
    • La fidélité des utilisateurs aux services d’IA apparaît supérieure à celle observée pour la recherche traditionnelle
  • Effets de l’usage des chatbots IA dans les entreprises américaines
    • Parmi les salariés américains qui utilisent des chatbots IA, plus de 72 % disent obtenir un travail « plus rapide et de meilleure qualité »
    • Des évolutions positives sont rapportées à la fois sur l’efficacité au travail et sur la qualité des tâches réalisées
  • Cas d’usage de ChatGPT chez les étudiants américains
    • Chez les étudiants américains (18-24 ans), ChatGPT est utilisé principalement pour démarrer une dissertation ou un projet, résumer des textes, faire du brainstorming, résoudre des problèmes, préparer des examens, faire de la recherche ou du tutorat, avec un fort accent sur les études, l’apprentissage et l’orientation
    • L’IA est activement mobilisée aussi bien pour résoudre des tâches concrètes que pour le travail créatif et la construction d’un projet professionnel
  • Services d’automatisation de deep research fondés sur l’IA
    • Les principaux acteurs comme Google Gemini, OpenAI ChatGPT et xAI Grok étendent leurs fonctions de deep research
    • L’automatisation de tâches cognitives avancées s’accélère : recherche web automatisée, production d’insights, génération automatique de rapports de plusieurs dizaines de pages, exploration factuelle, etc.

L’évolution des agents IA = des réponses en chat à l’automatisation réelle du travail

  • Alors que les chatbots traditionnels restaient limités à des échanges restreints et à des réponses simples, les agents IA évoluent désormais vers des prestataires de services capables de raisonner, exécuter et gérer des tâches multi-étapes de façon autonome
    • Exemples : planifier une réunion, soumettre un rapport, se connecter à des outils, automatiser des workflows entre plusieurs plateformes
    • Ils exécutent directement des tâches complexes à partir de simples instructions en langage naturel
  • Cette évolution rappelle la transition du début des années 2000, quand on est passé de sites web statiques à des web apps dynamiques comme Gmail ou Google Maps
    • On passe d’une simple interface de messagerie à une infrastructure capable d’exécuter des tâches réelles
  • Contrairement aux premiers assistants, qui ne fournissaient que des entrées explicites ou des résultats limités, les agents IA deviennent capables d’exécuter des processus complexes — interprétation de l’intention, gestion de la mémoire, collaboration entre apps — grâce à une approche orientée objectifs, davantage d’autonomie et des garde-fous
  • Les entreprises sont celles qui accélèrent le plus vite leur adoption, en allant au-delà de l’expérimentation pour investir sérieusement dans des frameworks et construire un écosystème d’agents
  • Forte hausse de l’intérêt mondial pour les AI Agent (tendances de recherche Google, 2024-2025)
    • Le volume de recherches Google sur le mot-clé « AI Agent » a bondi de 1 088 % en 16 mois
    • Après le lancement par OpenAI d’outils de développement pour AI Agent en mars 2025, les recherches ont encore accéléré, ce qui laisse penser que le secteur a franchi un tournant technologique
  • Accélération des lancements de produits AI Agent par les acteurs historiques de l’IA (2024-2025)
    • De grands groupes technologiques comme Salesforce, Anthropic, OpenAI et Amazon lancent les uns après les autres de nouveaux produits fondés sur des agents IA
      • Salesforce Agentforce : automatisation du support client, détection de leads, suivi des commandes, etc.
      • Anthropic Claude 3.5 Computer Use : contrôle direct de l’écran d’ordinateur, extraction de données web, achats en ligne, etc.
      • OpenAI Operator : automatisation de tâches en ligne complexes
      • Amazon Nova Act : domotique, collecte d’informations, achats, gestion de planning, etc.
    • Les produits AI Agent vont au-delà du chatbot classique pour devenir de véritables outils d’automatisation capables d’effectuer un travail concret

Next Frontier For AI = Artificial General Intelligence

  • Qu’est-ce que l’Artificial General Intelligence (AGI) ?
    • L’AGI désigne un système capable d’accomplir l’ensemble des tâches intellectuelles humaines — raisonnement, planification, apprentissage à partir de petits volumes de données, généralisation des connaissances entre différents domaines, etc.
    • Contrairement aux modèles d’IA actuels, très performants dans des domaines spécifiques, l’AGI pourrait résoudre avec souplesse de nouveaux problèmes sans réentraînement, quel que soit le domaine
    • La croissance exponentielle de la taille des modèles, des données d’entraînement et de l’efficacité du calcul accélère aujourd’hui le développement de l’AGI
  • Calendrier d’arrivée de l’AGI et niveau d’attente
    • Le moment où l’AGI sera atteint reste incertain, mais les attentes des experts se sont fortement rapprochées ces dernières années
    • En janvier 2025, le CEO d’OpenAI Sam Altman a déclaré : « Nous sommes désormais convaincus de savoir comment construire ce que nous avons traditionnellement compris comme étant l’AGI »
    • Cela suggère que les avancées dans l’architecture des modèles, l’efficacité de l’inference et les environnements d’entraînement à grande échelle réduisent l’écart entre recherche et déploiement réel
      • L’inference est le processus par lequel un modèle entièrement entraîné produit des prédictions, des réponses ou du contenu à partir d’une entrée utilisateur. Cette phase est bien plus rapide et efficace que l’entraînement
    • L’AGI commence à être perçue non plus comme un point d’arrivée théorique, mais comme un seuil atteignable
  • Ce que signifie l’atteinte de l’AGI
    • Si l’AGI se concrétise, le rôle fondamental du software et du hardware sera redéfini
    • Au lieu de répéter des tâches préprogrammées, les systèmes pourront comprendre un objectif, établir un plan et se corriger en temps réel
    • Des workflows dans la recherche, l’ingénierie, l’éducation ou la logistique pourraient fonctionner sans supervision humaine
    • Même face à de nouveaux problèmes, ces systèmes s’adapteraient au contexte sans réentraînement, à la manière d’experts humains
    • Des robots humanoïdes fondés sur l’AGI pourraient transformer en profondeur l’environnement physique et la manière de travailler
  • L’impact sociétal de l’AGI
    • L’AGI n’est pas un objectif final, mais une transition graduelle des capacités
    • Les institutions, le travail et les structures de décision seront reconfigurés selon la manière dont l’AGI est déployée et contrôlée
    • Les gains de productivité pourraient être considérables, mais leurs bénéfices pourraient aussi être répartis de façon inégale
    • Les changements géopolitiques, éthiques et économiques devraient se produire progressivement
    • Comme lors de la révolution industrielle, de la transformation numérique ou de la révolution algorithmique, les résultats dépendront non seulement de ce que la technologie permet de faire, mais aussi de la manière dont la société l’accepte et l’encadre

AI User + Usage + CapEx Growth = sans précédent

  • Au cours des vingt dernières années, les CapEx dans la tech ont fortement progressé en suivant un arc centré sur la donnée
    • Les investissements ont d’abord porté sur le stockage et l’accès, puis sur la distribution et le passage à l’échelle, avant de se concentrer aujourd’hui sur le calcul et l’intelligence
  • Lors de la première vague, les capitaux se sont concentrés sur les fermes de serveurs à grande échelle, les câbles sous-marins et les premiers data centers, permettant à Amazon, Microsoft et Google de poser les bases du cloud computing
    • À ce stade, l’objectif central était de « stocker, organiser et fournir des services »
  • La deuxième vague, toujours en cours, est centrée sur le renforcement des infrastructures de calcul pour les workloads IA
    • Les CapEx des hyperscalers se déplacent vers des infrastructures spécialisées : GPU, TPU, accélérateurs IA, refroidissement liquide, conception avancée de data centers
    • En 2019, l’IA relevait encore de la recherche ; en 2023, elle est devenue un poste central des CapEx (dépenses d’investissement)
  • Brad Smith, président de Microsoft (blog du 25/04) :
    • « À l’image d’une technologie généraliste comme l’électricité, les data centers IA et cloud représentent la prochaine étape de l’industrialisation »
  • Les grands groupes technologiques mondiaux investissent des dizaines de milliards de wons par an
    • Il ne s’agit plus seulement de collecter des données, mais de développer la capacité à apprendre vite, personnaliser en profondeur et déployer à grande échelle, devenue le cœur de l’avantage concurrentiel
  • Les dépenses de CapEx (investissements d’équipement) des grands groupes technologiques comme AWS, NVIDIA, MSFT, Google, Apple et Meta augmentent régulièrement depuis plusieurs années

Data Centers = les principaux bénéficiaires des dépenses de CapEx IA

  • Pour comprendre l’économie de l’infrastructure IA, il faut examiner le rythme et l’ampleur de la construction des data centers
    • Sous l’effet de l’explosion de la demande centrée sur l’IA, les CapEx (dépenses d’investissement) des data centers des entreprises IT mondiales ont atteint un niveau record, à 455 milliards de dollars en 2024, et continuent d’accélérer
  • Les hyperscalers comme les entreprises AI-first investissent tous des milliards de dollars dans des infrastructures matérielles haute performance et à forte consommation électrique, non seulement pour le stockage, mais aussi pour l’inférence en temps réel et l’entraînement de modèles à grande échelle
    • À mesure que l’IA passe d’une technologie expérimentale à une infrastructure essentielle, les data centers occupent eux aussi une place centrale
    • Jensen Huang, CEO de NVIDIA, a souligné que « les data centers IA sont désormais des usines à IA »
  • Le data center Colossus de xAI à Memphis, dans le Tennessee, a achevé un bâtiment équivalant à 418 maisons en seulement 122 jours, atteignant une vitesse et une efficacité sans précédent (soit moins de la moitié du temps moyen de construction d’une maison aux États-Unis)
    • Grâce à des modules préfabriqués, à des autorisations accélérées et à l’intégration verticale de l’électricité, du mécanique et du logiciel, une ère s’ouvre où les data centers sont construits au rythme du développement des produits IT
  • Les CapEx des data centers dépendent du foncier, de l’électricité, des puces et des équipements de refroidissement, tandis que les charges de travail IA génèrent des besoins en chaleur et en énergie bien supérieurs à ceux de l’informatique d’entreprise traditionnelle
    • Les OpEx (coûts d’exploitation) sont principalement portés par les coûts énergétiques et la maintenance des systèmes, en particulier pour les clusters d’entraînement IA à haute densité qui fonctionnent en permanence à charge maximale
  • Les revenus proviennent de la vente de compute (API IA, facturation des plateformes d’entreprise, gains de productivité internes, etc.), mais les entreprises qui construisent de façon anticipée peuvent voir leur délai de retour sur investissement s’allonger
    • Pour les nouveaux entrants, la monétisation peut prendre de plusieurs trimestres à plusieurs années après la construction de l’infrastructure
  • Côté supply chain, la sécurisation des infrastructures électriques (transformateurs, sous-stations, turbines, GPU, câbles, etc.) apparaît comme le nouveau goulet d’étranglement
    • Les data centers ne sont pas de simples actifs physiques : ils jouent le rôle de hubs d’infrastructure stratégiques à l’intersection de l’immobilier, de l’énergie, de la logistique, du compute et de la monétisation logicielle
  • Les entreprises qui sauront résoudre correctement ce puzzle complexe façonneront demain la géographie de l’économie de l’IA

Data Centers = des gouffres électriques

  • La tension entre l’IA et les infrastructures énergétiques s’intensifie progressivement
    • Avec la montée en puissance de l’IA, les data centers spécialisés IA affichent désormais une consommation électrique comparable à celle de l’industrie lourde traditionnelle
    • L’énorme puissance de calcul nécessaire à l’entraînement et au service des modèles IA est la principale cause de l’explosion de la demande en électricité
  • En 2024, les data centers représentent environ 1,5 % de la consommation mondiale d’électricité
    • Depuis 2017, la consommation électrique mondiale des data centers a augmenté de 12 % par an en moyenne
    • Soit plus de quatre fois le rythme de croissance de la consommation électrique totale
  • En part de consommation électrique par pays, les États-Unis arrivent en tête avec 45 %, devant la Chine (25 %) et l’Europe (15 %)
    • Près de la moitié de la capacité des data centers américains est concentrée dans cinq grands clusters régionaux
    • Les pays émergents et en développement (hors Chine) représentent 50 % des internautes, mais disposent de moins de 10 % de la capacité de data centers
  • Avec la diffusion de l’IA, le réseau électrique (grid) et les infrastructures d’approvisionnement deviennent le goulet d’étranglement des performances de l’IA
    • Ce ne sont plus les données ni les algorithmes, mais bien l’alimentation électrique qui devient la contrainte clé de la croissance de l’IA
  • Parallèlement, l’IA accélère l’efficacité opérationnelle et l’innovation dans le secteur de l’énergie
    • L’optimisation fondée sur l’IA est désormais appliquée à l’ensemble de la chaîne énergétique : production électrique, minerais, transport et consommation
    • Mais tant que la demande liée à l’IA et le coût de l’énergie continuent d’augmenter, les data centers finiront par ne servir que les clients capables d’en payer le prix

Coûts de compute des modèles IA élevés / en hausse + baisse des coûts d’inférence par token = convergence des performances + hausse de l’usage chez les développeurs

  • L’entraînement des grands modèles de langage (LLM) est l’une des activités les plus intensives en coûts de l’histoire humaine : à mesure que le nombre de paramètres et la complexité algorithmique augmentent pour améliorer les performances, les coûts d’entraînement grimpent à plusieurs milliards de dollars
    • Plus la compétition pour construire les meilleurs modèles généralistes s’intensifie, plus la différenciation de la qualité des résultats devient difficile et la rentabilité se dégrade, entraînant un phénomène de « convergence »
  • À l’inverse, les coûts d’inférence chutent rapidement
    • Par exemple, le GPU NVIDIA Blackwell 2024 consomme 105 000 fois moins d’énergie par token que Kepler en 2014
    • Grâce aux innovations matérielles et aux gains d’efficacité des algorithmes, le coût d’inférence par token baisse rapidement
  • La baisse des coûts d’inférence intensifie la concurrence entre fournisseurs de LLM
    • La compétition ne porte plus seulement sur la précision, mais aussi sur la latence, la disponibilité et le prix par token
    • Les coûts exprimés en dollars sont désormais tombés à quelques centimes, et bientôt à moins d’un centime
  • Du point de vue des utilisateurs (développeurs), cela permet d’accéder à une IA puissante à faible coût
    • Le développement de nouveaux services et produits s’accélère, et le nombre d’utilisateurs comme les usages réels augmentent rapidement
  • Pour les fournisseurs de modèles, de nouveaux défis apparaissent : dégradation de la rentabilité et évolution des business models
    • L’entraînement est cher tandis que la fourniture devient bon marché, d’où la recherche de nouvelles stratégies comme l’intégration verticale/horizontale ou les marchés de LLM spécialisés
    • Les LLM généralistes commencent à prendre la forme d’une guerre d’usure peu rentable
    • Avec l’émergence de modèles plus petits et sur mesure, les expérimentations autour de structures de revenus différenciées par rapport aux grands modèles traditionnels entrent dans une phase active

Baisse des coûts d’inférence par token

  • La baisse des coûts d’inférence IA reproduit un schéma classique du progrès informatique
    • Comme le disait Nathan Myhrvold, CTO de Microsoft, en 1997 : « le logiciel est comme un gaz, il remplit entièrement le récipient qu’on lui donne » ; de la même manière, la demande pour l’IA augmente jusqu’à absorber toute l’infrastructure disponible
    • À mesure que les performances des modèles progressent, les usages (requêtes, tokens, nombre de modèles) explosent, et le champ comme la fréquence d’utilisation de l’IA s’élargissent rapidement
  • Le rythme des progrès de l’infrastructure atteint lui aussi des sommets historiques
    • En 2024, le GPU NVIDIA Blackwell a amélioré de 105 000 fois l’efficacité énergétique de la génération de tokens par rapport à Kepler en 2014
    • Cela montre qu’il ne s’agit pas seulement d’une baisse des coûts, mais bien du résultat d’innovations dans l’architecture matérielle et les matériaux
  • Les gains d’efficacité du hardware sont un élément clé pour compenser la charge électrique liée à l’explosion de la demande en IA et en Internet
    • Mais jusqu’ici, ces améliorations n’ont pas suffi à empêcher complètement la hausse de la demande totale en électricité
    • Ce phénomène rappelle le paradoxe de Jevons de 1865
      • Plus l’efficacité d’une ressource augmente, plus sa consommation totale peut paradoxalement croître — et ce schéma se répète aussi avec l’IA
  • En conséquence, la vieille formule technologique — baisse des coûts, hausse des performances, augmentation des usages — se répète avec l’IA
    • Les progrès de l’infrastructure stimulent à nouveau l’adoption de l’IA, tout en soulevant de nouvelles questions sur les infrastructures électriques et la production d’énergie

Convergence des performances

  • Convergence rapide au sommet des performances des modèles IA
    • D’après les données de LMSYS Chatbot Arena de Stanford HAI (2024-2025), les scores d’évaluation des chatbots de Google, OpenAI et DeepSeek s’établissent à 1 385, 1 366 et 1 362, soit un écart minime d’environ 1 à 2 % seulement
    • En l’espace d’un an, l’écart entre les meilleurs modèles n’a cessé de se réduire, montrant clairement une tendance à l’uniformisation de la compétition sur les performances
  • Il devient de plus en plus difficile de différencier la qualité entre les derniers grands modèles de langage (LLM)
    • Du point de vue des utilisateurs, un environnement se met en place où l’on peut avoir l’impression que « quel que soit le modèle choisi, c’est presque pareil »
    • Les fournisseurs de modèles pourraient donc se déplacer vers une concurrence fondée sur des facteurs non liés à la performance, comme le coût, la stabilité du service ou les fonctionnalités spécialisées

Hausse de l’usage chez les développeurs

  • L’explosion de l’activité des développeurs IA provient de la chute spectaculaire des coûts d’inférence et de l’élargissement de l’accès à des modèles performants
    • Entre 2022 et 2024, le coût par token pour exécuter des modèles de langage a baissé d’environ 99,7 %
      • Cette évolution s’explique par des progrès fulgurants du matériel et de l’efficacité des algorithmes
      • Des technologies autrefois réservées aux grandes entreprises sont désormais facilement accessibles aux développeurs individuels, créateurs d’apps indépendants, chercheurs et petites entreprises
    • L’effondrement des coûts rend l’expérimentation peu chère et accélère les itérations ainsi que l’industrialisation
      • Avec une simple idée, n’importe qui peut désormais développer facilement un service IA
  • À mesure que les performances des modèles convergent rapidement, la logique de sélection des modèles évolue
    • L’écart entre les grands modèles haut de gamme et des alternatives plus petites et plus efficaces se réduit
    • Sur de nombreuses tâches réelles comme le résumé, la classification, l’extraction ou le routage, les différences de performance sont quasiment nulles
    • Les développeurs peuvent désormais obtenir des résultats comparables avec des modèles moins chers ou via une exécution locale / des API à bas coût, plutôt qu’avec des modèles premium onéreux
    • L’effet est particulièrement fort en cas de fine-tuning sur des données spécialisées pour une tâche donnée
  • Ce changement affaiblit le levier tarifaire des acteurs historiques du modèle et favorise la démocratisation du développement IA
    • Au lieu de dépendre d’un fournisseur unique, les développeurs combinent et répartissent l’usage de modèles issus de différents écosystèmes
    • OpenAI ChatGPT, Meta Llama, Mistral Mixtral, Anthropic Claude, Google Gemini, Microsoft Phi, etc.
      • Parmi des modèles aux points forts variés, il devient possible de choisir le modèle optimal selon les besoins techniques et financiers
    • On sort du lock-in de plateforme pour entrer dans une ère de choix et de répartition menée par les développeurs
  • Un flywheel de croissance de l’infrastructure piloté par les développeurs est en train de se former
    • À mesure que davantage de développeurs créent des apps nativement IA, l’écosystème des outils/wrappers/bibliothèques/frameworks explose
    • Frameworks frontend, pipelines d’embedding, routeurs de modèles, vector DB, couches de serving, etc.
      • Chaque vague d’activité des développeurs réduit à son tour les barrières à l’entrée pour la vague suivante
  • Le temps nécessaire pour passer de l’idée au prototype, puis du prototype au produit, se raccourcit
    • Non seulement les coûts, mais aussi la complexité, diminuent rapidement
    • Au-delà d’un simple changement de plateforme, c’est une ère d’explosion créative qui s’ouvre
  • Historiquement aussi, on retrouve un même schéma : les plateformes qui attirent beaucoup de développeurs et maintiennent leur usage finissent par gagner
    • Comme l’a montré le discours de Steve Ballmer chez Microsoft, « Developers! Developers! Developers! », les développeurs sont essentiels
    • Les plateformes adoptées par les développeurs, capables de soutenir une montée en charge continue et d’entraîner des améliorations, finiront par dominer le marché

The AI Developer Next Door

  • Forte hausse de l’adoption des outils de développement IA (2023~2024, Stack Overflow)
    • Par rapport à 2023, la part des développeurs utilisant des outils IA a fortement augmenté en 2024
    • Chez les développeurs professionnels, elle passe de 44 % à 63 %, et chez les personnes apprenant à coder, de 55 % à 65 %
  • Explosion des dépôts open source de développeurs IA (GitHub, 2022.11~2024.3)
    • Le nombre de dépôts GitHub liés aux développeurs IA a augmenté d’environ 175 % en 16 mois
    • Après l’arrivée de modèles et d’outils majeurs comme ChatGPT et Stable Diffusion, l’écosystème de développement a connu une croissance explosive
  • Expansion de l’écosystème des développeurs IA (selon Google, utilisation mensuelle de tokens)
    • De 10 billions de tokens en mai 2024 à 480 billions en mai 2025, soit une multiplication par 50 en un an
    • L’usage des développeurs a fortement augmenté via Google Gemini, AI API, etc.
  • Croissance de l’écosystème Microsoft Azure AI Foundry (utilisation trimestrielle de tokens)
    • De 20 billions au 1er trimestre 2024 à 100 billions de tokens au 1er trimestre 2025, soit une croissance par 5
    • Plus de 70 000 entreprises et développeurs l’utilisent
  • Diversification des cas d’usage chez les développeurs IA (2024, selon IBM)
    • Génération de code, détection/correction de bugs, automatisation des tests, gestion de projets/workflows, documentation, refactoring/optimisation, renforcement de la sécurité, CI/CD, design UX, conception d’architecture : l’usage de l’IA s’accélère dans un large éventail de domaines

AI Usage + Cost + Loss Growth = Unprecedented

  • La croissance de l’IA, ainsi que l’ampleur des coûts et des pertes, atteignent un niveau sans précédent
    • Des signaux d’alerte tels que « cette fois, c’est différent », « les économies d’échelle permettront d’atteindre la rentabilité » ou « on monétisera les utilisateurs plus tard » ont souvent conduit à l’échec par le passé, mais certains investissements de la big tech ont réellement débouché sur des succès
    • Cette compétition autour de l’IA voit simultanément entrer en scène des capitaux d’une ampleur inédite et de grandes entreprises guidées par leurs fondateurs
    • La concurrence entre grandes puissances mondiales comme les États-Unis et la Chine accélère l’innovation en IA
  • Chaque grande vague d’adoption technologique s’accompagne d’un point de bascule
    • Pour l’ordinateur personnel : Macintosh (1984) et Windows 3.0 (1990) ; pour Internet : l’IPO de Netscape (1995) ; pour le mobile : l’App Store de l’iPhone (2008) ; pour le cloud : AWS (2006~09) ; pour l’IA : NVIDIA A100 (2020) et ChatGPT (2022) ont été des déclencheurs décisifs
    • En 2025, l’arrivée de DeepSeek en Chine a marqué un nouveau signal d’intensification de la concurrence mondiale en IA
  • Les financements de la croissance de l’IA proviennent des énormes flux de trésorerie des géants de la tech et du capital mondial
    • La combinaison d’une concurrence féroce, du capital et de l’esprit entrepreneurial accélère le développement de l’IA
  • Cela dit, le business model du vainqueur final reste encore incertain

Technology Disruption Pattern Recognition = Hundreds of Years of Consistent Signals

  • L’histoire de l’innovation technologique répète un cycle de surchauffe initiale, afflux de capitaux, intensification de la concurrence, puis distinction entre gagnants et perdants
    • Exemple : les chemins de fer au XIXe siècle, la bulle des années 1840, l’effondrement des attentes, etc.
  • Les technologies nécessitant d’énormes investissements en capital affichent souvent des rendements décevants au départ, mais peuvent transformer durablement la structure industrielle en cas de succès
    • En revanche, si elles ne sont pas protégées contre la concurrence, elles comportent un risque élevé
  • Le vainqueur final n’est pas toujours celui qui possède la meilleure technologie, mais celui qui lit le plus clairement les dynamiques du marché et de l’industrie
  • Sur les marchés sans barrières à l’entrée, l’avantage du premier entrant disparaît rapidement
    • Il faut garder en tête cette leçon : « les gagnants des nouvelles technologies sont difficiles à prévoir, mais les perdants se repèrent facilement »

AI-Related Monetization = Very Robust Ramps

  • Évolution de la stratégie matérielle IA : le contrôle de la conception des puces se déplace des fournisseurs traditionnels vers les entreprises plateformes
    • Les GPU NVIDIA jouent depuis longtemps le rôle de moteur de base pour l’entraînement et l’inférence IA, ce qui leur a assuré une position dominante
    • La forte explosion de la demande maintient des tensions sur l’offre malgré l’accélération de la production chez NVIDIA, poussant les hyperscalers et les acteurs du cloud à diversifier leur supply chain
  • Montée en puissance des puces sur mesure (ASIC) : l’adoption d’ASIC optimisés pour certains calculs IA s’accélère face aux GPU généralistes
    • Les puces TPU de Google et Trainium d’Amazon sont devenues des éléments clés de leurs stacks IA respectifs
      • Amazon Trainium2 offre un rapport prix/performance supérieur de 30 à 40 % à celui des GPU généralistes, avec à la clé une réduction possible des coûts d’inférence à grande échelle
    • Ces puces custom ne sont plus de simples expérimentations, mais une stratégie centrale pour la performance, l’efficacité économique et le contrôle de l’architecture
  • Les efforts pour améliorer l’économie de l’infrastructure IA se généralisent
    • Andy Jassy, CEO d’Amazon : « L’IA n’a pas besoin d’être aussi chère qu’aujourd’hui, et elle deviendra moins coûteuse à l’avenir »
    • Le silicium sur mesure est l’un des principaux leviers de réduction des coûts d’infrastructure IA
  • Croissance des entreprises spécialisées dans l’infrastructure IA
    • CoreWeave : croissance rapide après avoir reconfiguré une supply chain issue du gaming et des matériels liés aux cryptomonnaies en cloud GPU pour l’IA
    • Oracle : transition de l’IT traditionnel vers une plateforme cloud GPU spécialisée IA
    • Astera Labs : fournit des interconnexions ultra-rapides entre GPU et mémoire, contribuant à dépasser les limites de performance des grands modèles
  • Ces entreprises ne développent pas directement de foundation models, mais construisent l’infrastructure indispensable à leur écosystème
    • Avec l’explosion de la demande de calcul, vitesse, disponibilité et efficacité deviennent les clés de la compétitivité

AI Monetization = Chips

  • Les revenus des puces IA de grandes entreprises comme NVIDIA, Google et Amazon connaissent une croissance rapide
    • Le chiffre d’affaires trimestriel de NVIDIA a augmenté de 78 % sur un an pour dépasser 39 milliards de dollars, principalement grâce à la division datacenter
    • Sur les dix dernières années, le chiffre d’affaires de NVIDIA a été multiplié par 28, tandis que les investissements en CapEx + R&D des géants américains de la tech (Apple, Microsoft, Alphabet, Amazon, Meta, NVIDIA) ont été multipliés par 6
    • Les revenus des TPU (Tensor Processing Unit) de Google sont estimés à 8,9 milliards de dollars, en hausse annuelle de 116 %
      • Les TPU de Google sont des puces ASIC spécialisées dans l’entraînement de modèles d’IA, avec plus de 100 000 unités produites au total depuis la sortie de la première version en 2015
    • Les revenus des puces AWS Trainium d’Amazon devraient atteindre 3,6 milliards de dollars en 2025, en hausse annuelle de 216 %
      • Trainium2 offre un avantage prix/performance de 30 à 40 % par rapport aux instances classiques basées sur GPU, avec jusqu’à 4 fois plus de performances
  • Les moteurs de la croissance du marché des puces IA
    • L’explosion de la demande pour l’entraînement et l’inférence en IA provoque une hausse massive de la demande de puces hautes performances comme les GPU et les ASIC
    • Les principaux acteurs du cloud et hyperscalers se concentrent sur la conception de leurs propres puces et sur le renforcement de leur supply chain, afin d’améliorer leur compétitivité-prix et l’efficacité de leur infrastructure
    • Les puces spécialisées pour l’IA, comme les GPU, TPU et Trainium, s’imposent comme une source de revenus clé pour les datacenters et un facteur déterminant de compétitivité dans l’infrastructure IA

AI Monetization = Compute Services

  • Croissance du marché des services de calcul IA
    • Le chiffre d’affaires 2024 de CoreWeave, spécialiste du cloud pour l’infrastructure IA, a augmenté de 730 % sur un an pour atteindre 1,9 milliard de dollars
    • La croissance de l’entreprise s’accélère grâce à de grands contrats avec des clients majeurs comme OpenAI, à son IPO et à l’acquisition de Weights & Biases
    • Avec l’explosion de la demande pour des infrastructures cloud hautes performances dédiées aux workloads IA, les fournisseurs d’infrastructure continuent d’enregistrer une croissance ultra-rapide de leurs revenus
  • Expansion du marché de l’infrastructure IA
    • Les revenus de l’infrastructure IA d’Oracle ont été multipliés par 50 en deux ans pour atteindre 950 millions de dollars en 2024 (estimation de Morgan Stanley)
    • Avec la hausse de la demande pour l’infrastructure IA, de nouveaux contrats clients d’envergure sont en attente, et il existe encore d’importantes réservations qui n’ont pas encore été réellement servies
    • Le CEO d’Oracle a indiqué qu’avec l’afflux de clients IA, il y avait « plus de 40 nouveaux contrats de plus d’un milliard de dollars »
  • Croissance de la connectivité de l’infrastructure IA
    • Astera Labs a enregistré en 2024 une croissance de 242 % sur un an de son chiffre d’affaires, à 396 millions de dollars
    • Ses gammes de produits de connectivité haut débit, comme PCIe, CXL et Ethernet, sont déployées chez de nombreux clients et plateformes, devenant une infrastructure essentielle dans les datacenters IA, notamment pour la connexion GPU et les clusters d’accélérateurs IA back-end
  • Collecte de données IA et supercalcul
    • Grâce au supercalculateur Dojo et à un déploiement massif de GPU, Tesla a augmenté sa capacité d’entraînement IA de 8,5 fois par rapport à juin 2021 (à septembre 2024)
    • Dojo est considéré comme ayant un très fort potentiel, non seulement pour révolutionner les coûts d’entraînement internes, mais aussi pour être transformé en service externe à la manière d’AWS
    • Elon Musk a déclaré que « le potentiel de Dojo est très grand »

AI Monetization = Data Layer

  • La monétisation de la couche data de l’IA s’accélère
  • Scale AI a vu son chiffre d’affaires passer de 335 millions de dollars en 2023 à 870 millions de dollars en 2024, soit une hausse de 160 %
    • L’entreprise fournit une infrastructure clé pour le passage à l’échelle des frontier LLM, notamment le data labeling, l’évaluation et la mise en place de pipelines
    • Elle affiche la vision suivante : « l’abondance de données est un choix, et nous ne laisserons pas les limites de l’IA être déterminées par un manque de données »
    • Plus de 1,5 milliard de dollars de nouveaux contrats ont été sécurisés rien qu’en 2024
  • VAST Data a atteint 2 milliards de dollars de chiffre d’affaires cumulé entre janvier 2019 et mai 2025
    • L’entreprise simplifie la couche d’infrastructure IA et fournit des services de stockage, de gestion et de traitement des données
    • Avec la montée en puissance des modèles d’AI Reasoning, l’importance de l’infrastructure data devient plus visible
    • L’entreprise souligne que « pour réaliser le plus grand potentiel à l’ère de l’IA, il est essentiel de simplifier les problèmes fondamentaux »

Forte croissance du chiffre d’affaires, consommation massive de cash, valorisations élevées, montants d’investissement élevés = une bonne nouvelle pour les consommateurs, incertain pour le reste

  • Avec la croissance de la base mondiale d’utilisateurs numériques et la possibilité d’une forte hausse des usages, le domaine de l’investissement des entreprises devient de plus en plus compétitif et capitalistique
    • La destruction créatrice du cycle technologique de l’IA présente des similitudes avec les trajectoires de croissance des grandes entreprises IT du passé
  • Cas de grandes entreprises tech historiques comme Apple, Amazon, Google, Uber et Tesla :
    • Apple : d’une capitalisation boursière de 1,7 milliard de dollars en 1997, alors au bord de la faillite, à 3 200 milliards de dollars aujourd’hui
    • Amazon : une perte de 545 millions de dollars sur la seule année 2000, 3 milliards de dollars de pertes sur 27 trimestres après sa création, puis 176 milliards de dollars de bénéfice net sur les 27 trimestres récents, pour une capitalisation actuelle de 2 200 milliards de dollars
    • Google : lors de son IPO en 2004, l’entreprise investissait 22 % de ses 390 millions de dollars de chiffre d’affaires en CapEx ; sa capitalisation est passée de 23 milliards de dollars à l’IPO à 2 000 milliards de dollars aujourd’hui
    • Uber : 17 milliards de dollars de cash brûlé entre 2016 et 2022, premier retour à la rentabilité en 2023, et une capitalisation passée de 82 milliards de dollars à l’IPO à 189 milliards de dollars aujourd’hui
    • Tesla : 9,2 milliards de dollars consommés entre 2009 et 2018, premier retour à la rentabilité en 2019, puis 40 milliards de dollars de bénéfice net sur cinq ans, pour une capitalisation actuelle de 1 100 milliards de dollars
  • Toutes ces entreprises ont accepté des investissements agressifs et des pertes de long terme pour bâtir des effets de réseau fondés sur la donnée et des avantages concurrentiels technologiques, avant de finir par prouver leur valeur sur le marché
  • En définitive, la valorisation d’une entreprise doit être justifiée par la valeur actuelle de ses flux de trésorerie disponibles futurs
  • Dans le secteur de l’IA aussi, seul le temps dira quels acteurs seront finalement capables de générer des revenus durables

Usage + Cost + Loss Growth = à un niveau sans précédent… quelle monétisation et quels profits à venir ?

AI Monetization Possibilities = New Entrants & / Or Tech Incumbents?

  • Pour comprendre l’évolution de la structure économique des modèles d’IA, il faut examiner la tension entre capacités et coûts
  • L’entraînement de LLM géants est l’une des entreprises les plus coûteuses de l’histoire de l’humanité, et les coûts s’envolent à plusieurs milliards de dollars avec l’augmentation du nombre de paramètres et de la complexité des architectures
  • À l’inverse, le coût de l’inférence (Inference) chute brutalement grâce aux innovations hardware et aux gains d’efficacité algorithmiques
    • Exemple : le GPU Blackwell 2024 de NVIDIA réduit l’énergie par token d’un facteur 105 000 par rapport à Kepler en 2014
  • À mesure que l’inférence devient moins chère, la concurrence entre fournisseurs de LLM s’intensifie sur la précision, la latence, la disponibilité et le coût par token, et des tâches autrefois coûteuses deviennent désormais possibles à un coût presque négligeable
  • Pour les utilisateurs et les développeurs, la baisse des prix unitaires constitue une opportunité, entraînant une explosion des nouveaux services et usages
  • En revanche, pour les fournisseurs de modèles, les perspectives de monétisation et de profit deviennent plus incertaines
    • L’entraînement reste coûteux, tandis que la fourniture du service (serving) devient moins chère, ce qui affaiblit le pricing power
    • L’émergence d’un marché de petits modèles personnalisés fragilise les business moats existants
  • Exemple : Google a introduit AI Overviews dans la recherche à partir de mai 2024 (1,5 milliard de MAU au 15 avril 2025), et a récemment commencé à y intégrer de la publicité pour une partie des utilisateurs
  • À l’avenir, la concurrence devrait s’accélérer autour des stratégies de plateforme (expansion horizontale), des applications spécialisées et de divers modèles de monétisation, comme l’abonnement ou la publicité
  • À court terme, l’économie des LLM généralistes se rapproche de plus en plus d’un modèle marqué par des pertes de niveau venture et une concurrence de commoditisation

AI – New Entrants = Rapidly Laying Groundwork

  • État de l’adoption des modèles d’abonnement grand public par les principaux fournisseurs de modèles de fondation IA (à fin mai 2025)
    • Divers modèles comme OpenAI ChatGPT, xAI Grok, Google Gemini, Anthropic Claude et Perplexity proposent des abonnements gratuits/payants
      • OpenAI ChatGPT : 0 $ (gratuit) / 20 $ (Plus) / 200 $ (Pro) (par mois)
      • xAI Grok : 0 $ (gratuit) / 3 $ (Basic) / 8 $ (Premium) / 40 $ (Premium+) (par mois)
      • Google Gemini : 0 $ (gratuit) / 19,99 $ (AI Pro) / 250 $ (AI Ultra) (par mois)
      • Anthropic Claude : 0 $ (gratuit) / 17 $ (Plus) / 100 $ (Max) (par mois)
      • Perplexity : 0 $ (gratuit) / 20 $ (Pro) (par mois)
  • État de l’adoption des grilles tarifaires API développeur par les fournisseurs de modèles de fondation IA (à fin mai 2025)
    • OpenAI, xAI Grok, Google Gemini, Anthropic Claude et Perplexity, entre autres, facturent des tarifs à l’appel API selon l’unité
      • OpenAI ChatGPT : 0,40 $ par million de tokens (GPT-4.1 nano) à 40 $ (o3)
      • xAI Grok : 0,50 $ par million de tokens (grok-3-mini-beta) à 25 $ (grok-3-fast)
      • Google Gemini : 0,15 $ par million de tokens (1.5 Flash-8B) à 15 $ (2.5 Pro Preview)
      • Anthropic Claude : 1,25 $ par million de tokens (Claude 3 Haiku) à 75 $ (Claude 3 Opus)
      • Perplexity : 1 $ par million de tokens (Sonar) à 15 $ (Sonar Pro)

AI – New Entrants = Rapid Revenue Growth

  • Croissance du nombre d’abonnés payants et du chiffre d’affaires annuel d’OpenAI (octobre 2022 à avril 2025)
    • Le nombre d’abonnés payants à ChatGPT a augmenté de 153 % par an, atteignant environ 20 millions en avril 2025
    • Le chiffre d’affaires annuel d’OpenAI a progressé de 1 050 %, dépassant 3,7 milliards de dollars en avril 2025
  • Le chiffre d’affaires annualisé d’Anthropic, tiré des API et de la recherche générative, a été multiplié par 20 en 18 mois (2 milliards de dollars)
    • Stratégie de nouveaux modèles centrés sur le reasoning, comme Claude 3.7 Sonnet, et extension de l’usage de l’IA dans des tâches réelles
    • Croissance de 6,4x sur un an
  • Le chiffre d’affaires annualisé de Perplexity, tiré de la recherche générative, a été multiplié par 7,6 en 14 mois (120 millions de dollars)
    • Mise en avant de sources de référence pour chaque réponse et d’une fonction d’assistant de recherche personnalisé
  • Le chiffre d’affaires annualisé de Glean dans la recherche d’entreprise et les agents a été multiplié par 10 en 24 mois (100 millions de dollars)
    • Conçu pour soutenir l’adoption de l’IA par les grandes entreprises et permettre l’exploitation de l’ensemble des connaissances de l’organisation
  • Il faut en moyenne 24 mois aux entreprises IA (top 100) pour atteindre un chiffre d’affaires annualisé de 5 millions de dollars
    • Un rythme 35 % plus rapide que les entreprises SaaS traditionnelles (moyenne SaaS : 37 mois, moyenne IA : 24 mois)

AI –Tech Incumbents = Broad & Steady Product / Feature Rollouts

  • Situation des utilisateurs IA mondiaux et des appareils des Tech Incumbents, comparée aux 800 millions d’utilisateurs de ChatGPT
    • Google, Meta, Apple, TikTok, Microsoft, Spotify, Amazon, X, Canva et d’autres étendent progressivement leurs produits IA en s’appuyant sur des bases d’utilisateurs de plusieurs centaines de millions à plusieurs milliards
  • Canva – Background Remover & Magic Media (12/19)
    • La fonctionnalité de suppression d’arrière-plan d’image lancée en 2019 conserve une popularité constante, avec plus de 3 milliards d’utilisations cumulées
    • Magic Media (texte → image/vidéo), lancé en 2024, a suscité une forte réponse de la communauté, avec plus de 290 millions de créations générées en un an
  • Spotify – AI DJ (2/23)
    • Des fonctionnalités innovantes comme AI DJ et les clips musicaux IA ont été lancées sur les marchés mondiaux à partir de février 2023, avec une disponibilité dans plus de 60 pays en mai 2024
    • AI DJ améliore la satisfaction des utilisateurs et la qualité du service Spotify grâce à des recommandations musicales personnalisées, de l’interaction et des capacités de reasoning en temps réel fondées sur les données
  • Microsoft – Copilot (2/23)
    • Copilot a été introduit dans Bing et Edge en février 2023, enregistrant plus de 15 milliards de conversations cumulées en décembre 2024
    • Copilot apporte une nouvelle expérience utilisateur fondée sur l’IA dans la recherche web, le navigateur et les outils bureautiques, contribuant à l’efficacité et à la créativité au quotidien
  • Meta Platforms – Meta AI (9/23)
    • En avril 2025, Meta AI approche 1 milliard d’utilisateurs actifs mensuels (MAU) sur l’ensemble des applications, dont Instagram, Messenger et WhatsApp
    • La stratégie met l’accent sur la volonté de prendre l’initiative dans le développement d’agents IA de niveau ingénieur intermédiaire ainsi que dans l’application de la recherche IA sur le terrain
  • X – Grok (11/23)
    • Avec la sortie de la version 3.0 en février 2025, Grok de xAI a vu ses visiteurs mondiaux sur desktop bondir de 42x sur un mois, dépassant 150 millions
    • L’accent est mis sur la quête de vérité de l’IA (value alignment) et le déploiement à grande échelle, tout en étendant l’expérience IA au sein de la plateforme X
  • Google – Gemini & AI Overviews (12/23)
    • En mai 2024, le chatbot Gemini comptait 400 millions de MAU, tandis qu’AI Overviews, intégré à Google Search, atteignait 1,5 milliard d’utilisateurs mensuels
    • Ses points forts sont les modèles IA multimodaux couvrant divers types de données (texte, code, image, audio, etc.) et les fonctions de résumé IA dans la recherche
  • Amazon – Rufus (2/24)
    • Amazon a introduit Rufus AI dans le retail nord-américain en février 2024, améliorant les recommandations personnalisées pour les informations produit, les résumés d’avis et plus encore
    • Avec la croissance du volume brut de marchandises (GMV) de l’activité retail, l’usage de l’IA continue de s’étendre
  • TikTok – Symphony AI Assistant (6/24)
    • Depuis l’introduction de Symphony Assistant en juin 2024, les visiteurs du site web mondial de TikTok ont été comptabilisés à plus de 2 milliards
    • L’IA produit des résultats concrets dans la création de contenus pour les marques et créateurs, l’efficacité publicitaire et l’affinité de marque
  • Apple – Apple Intelligence (10/24)
    • Entre septembre 2024 et mars 2025, les ventes d’appareils compatibles Apple Intelligence, comme les iPhone 15 Pro/Pro Max et la série iPhone 16, ont atteint 50 à 70 millions d’unités
    • L’accent est mis sur une expérience IA fondée sur la personnalisation, la confidentialité et le calcul local, via l’intégration du matériel et du logiciel

AI –Tech Incumbents = Rapid Revenue + Customer Growth

  • Revenus des produits IA de Microsoft
    • En 2024, l’estimation du chiffre d’affaires annuel de l’activité produits IA de Microsoft a atteint 13 milliards de dollars, en hausse de 175 % sur un an
    • Une gamme variée de produits IA, dont les services Azure AI, Microsoft 365 Copilot et Dynamics 365 Copilot, a porté la croissance du chiffre d’affaires
    • Le CEO Satya Nadella a déclaré que l’entreprise « aide à concrétiser le retour sur investissement (ROI) de l’IA et saisit une opportunité immense »
    • Lors de la publication des résultats du 1er trimestre 2025, Microsoft a souligné que les commercial bookings avaient augmenté de 18 %
  • xAI : recherche générative
    • En 2025, le chiffre d’affaires annuel de xAI devrait commencer à croître sérieusement
    • Son dernier modèle, Grok 3, s’appuie sur le superordinateur Colossus avec une puissance de calcul multipliée par plus de 10, ce qui améliore les performances sur des tâches exigeantes en raisonnement, mathématiques, code et connaissances
    • Le CEO Elon Musk a insisté sur le fait qu’il s’agit d’une « IA de recherche de la vérité, qui poursuit même les vérités politiquement inconfortables »
  • Clients commerciaux de Palantir aux États-Unis
    • En un an, le nombre de clients commerciaux de Palantir aux États-Unis a augmenté de 65 % pour atteindre 432
    • Sa plateforme IA AIP (Artificial Intelligence Platform) a contribué à l’acquisition de nouveaux clients et à l’expansion chez les clients existants
    • En 2025, le chiffre d’affaires commercial aux États-Unis a dépassé 1 milliard de dollars sur une base annuelle
    • La compétitivité de Palantir repose sur sa capacité à « maximiser le contexte au sein des entreprises grâce à l’AI Ontology et à offrir une capacité d’exécution différenciée »

Possibilités de monétisation de l’IA – Entreprise = plateforme horizontale et/ou logiciel spécialisé ?

  • Orientation de la monétisation de l’IA en entreprise
    • Les logiciels métiers traditionnels se sont développés comme des outils spécialisés pour des secteurs ou fonctions précis (Vertical SaaS)
    • Des solutions spécialisées par secteur comme Toast (restauration), Guidewire (assurance) et Veeva (sciences de la vie) dominent leur marché
    • Cependant, avec l’émergence des foundation models et de l’IA générative, de nouvelles opportunités de monétisation s’ouvrent dans de nombreux domaines
  • Montée des plateformes horizontales
    • Des plateformes d’entreprise horizontales émergent, intégrant productivité IA native, recherche, communication et gestion des connaissances dans une seule interface
    • Exemple : une combinaison de Slack + Notion + ChatGPT, qui intègre l’intelligence IA dans le contexte de travail de l’ensemble de l’organisation, au-delà des SaaS distincts existants
    • La valeur se déplace de la vente de licences SaaS vers une tarification fondée sur les résultats produits par l’IA embarquée
  • Concurrence entre plateformes horizontales et logiciels spécialisés
    • Microsoft intègre Copilot à l’échelle de toute l’entreprise, tandis que Zoom et Canva injectent l’IA générative dans les workflows utilisateurs
    • Databricks et d’autres intègrent l’IA dans la stack data et développeur
    • Des startups comme Glean défient le modèle classique des suites logicielles avec des workflows AI-first
    • À l’inverse, les éditeurs historiques de logiciels spécialisés réagissent aussi en embarquant l’IA, en automatisant les workflows et en adoptant rapidement des modèles adaptés grâce à des données sectorielles
    • Ces acteurs spécialisés disposent déjà de la confiance du marché, de données structurées et de workflows terrain, ce qui leur donne un avantage pour déployer une IA spécialisée par domaine
  • Perspectives
    • Les plateformes horizontales excellent dans l’intégration de multiples fonctions et la connexion des connaissances à l’échelle de l’entreprise
    • Les éditeurs spécialisés se différencient grâce à des fonctions IA approfondies adaptées aux réglementations, contrats et contextes clients propres à chaque secteur
    • L’enjeu clé sera de savoir qui abstraira la couche centrale et prendra le contrôle de l’interface utilisateur ainsi que de la logique métier
    • À l’ère de l’IA, la monétisation sera déterminée non par le simple volume d’usage, mais par l’"attention", le "context" et le "control"

Les incumbents du SaaS

  • Microsoft GitHub Copilot
    • Lancement officiel en juin 2022
    • Adopté par plus de 77 000 entreprises
    • Croissance de 180 % sur deux ans en glissement annuel
    • Communauté de 150 millions de développeurs, en hausse de 50 % sur deux ans
    • Plus de 500 millions de dollars de chiffre d’affaires annuel (sur une base trimestrielle)
  • Microsoft 365 Copilot
    • Annoncé en mars 2023, lancement officiel pour les entreprises en novembre 2023
    • Dès le premier trimestre après le lancement, de nombreux clients existants ont multiplié leur nombre de sièges par plus de 10
    • Le nombre d’utilisateurs a plus que doublé d’un trimestre à l’autre
    • Le taux d’usage par les employés a lui aussi fortement progressé, de plus de 60 % récemment
    • Plus de 75 % des CIO prévoient un déploiement dans les 12 prochains mois
  • Adobe Firefly
    • Bêta publique en mars 2023, commercialisation du modèle vidéo IA en février 2024
    • Très bien accueilli par les marques et les créateurs
    • Plus de 20 milliards d’actifs Firefly générés au total
    • Plus de 90 % des utilisateurs payants ont expérimenté la génération vidéo
    • Les utilisateurs actifs mensuels de GenAI dans Photoshop et Lightroom ont respectivement atteint 35 % et 30 %
  • Atlassian Intelligence
    • Bêta en décembre 2023, plus de 1 million de MAU en décembre 2024
    • En un an, l’usage des fonctions IA a été multiplié par 25
    • Plus de 10 % des clients ont adopté Atlassian Intelligence
  • Zoom AI Companion
    • Lancé en septembre 2023, adopté par 3,5 millions de comptes en décembre 2024
    • Le nombre de comptes actifs a augmenté de 68 % d’un trimestre à l’autre
    • AI Companion 2.0 propose des fonctions avancées comme la mémoire, le raisonnement et les intégrations
  • Canva Magic Studio
    • Lancé en octobre 2023, 16 milliards d’utilisations cumulées des outils IA en mai 2025
    • Utilisé par l’ensemble de la communauté créative, enterprise et associative
    • Plus de 10 milliards d’usages enregistrés des outils IA
  • Salesforce Agentforce
    • Annoncé en septembre 2024, avec 3 000 contrats payants signés en février 2025
    • Relié à Data Cloud pour transformer l’expérience client à grande échelle
    • Maintient une croissance de l’AI ARR supérieure à 120 % par an

OpenAI ChatGPT = plateforme enterprise horizontale potentielle ?

  • Microsoft Office Suite
    • Composée de 9 applications (Outlook, Word, Excel, PowerPoint, etc.)
    • A conquis plus de 400 millions d’utilisateurs payants en 34 ans (1990~2024)
  • OpenAI ChatGPT
    • Bien qu’il s’agisse d’une application unique, il a atteint 20 millions d’utilisateurs payants en seulement 2,5 ans (novembre 2022~avril 2025)
  • Expansion de ChatGPT Enterprise
    • En 9 mois après son lancement, des équipes l’ont adopté dans plus de 80 % des entreprises du Fortune 500
    • Les entreprises utilisatrices ont indiqué apprécier un déploiement simple et sécurisé
    • Les premiers clients l’utilisent activement pour améliorer la communication interne, accélérer les tâches de code, répondre rapidement à des questions métier complexes et soutenir le travail créatif
    • ChatGPT Enterprise ne comporte aucune limite d’usage et offre des performances jusqu’à 2 fois plus rapides que la version gratuite
    • Il donne aussi un accès illimité à l’analyse avancée de données (anciennement Code Interpreter)
    • Entre août 2023 et février 2025, le nombre d’utilisateurs enterprise, team et éducation a rapidement grimpé à 2 millions

Logiciels spécialisés dopés à l’IA dans les grands secteurs de services = croissance très rapide

  • Ingénierie logicielle
    • Cursor AI : ARR (revenu annuel récurrent) de 1 M$ à 300 M$ en 25 mois
    • Cursor est un éditeur de code IA qui offre une expérience utilisateur innovante pour l’écriture de code, le refactoring et l’automatisation
    • Plus de 1 milliard de caractères édités par jour, plus de 100 M$ de revenus récurrents
  • Développement produit (No-Code Product-Building)
    • Lovable : ARR multiplié par 13 en 5 mois, atteignant 50 M$
    • Plateforme no-code basée sur l’IA qui génère automatiquement, à partir d’une idée produit saisie en langage naturel, le code front-end/back-end, l’intégration à la base de données et même le déploiement
    • Permet à chacun de créer rapidement un produit et de lancer une activité
  • Santé (conversations cliniques)
    • Abridge : CARR (revenu récurrent contractuel) de 50 M$ à 117 M$ en 5 mois
    • Adopté par plus de 25 000 professionnels de santé, 40 hôpitaux et 600 établissements médicaux, utilisé plus de 10 millions de fois pour résumer les comptes rendus de consultations patients
    • Nombreux retours positifs de la part du personnel médical utilisateur
  • Juridique (automatisation des workflows)
    • Harvey : ARR de 10 M$ à 70 M$ en 15 mois, avec 235 clients dans 42 pays
    • Adopté par la majorité des 10 plus grands cabinets d’avocats américains, à l’avant-garde de l’automatisation des workflows des services juridiques et professionnels et des gains d’efficacité
  • Support client (AI Support Agents)
    • Decagon : ARR d’environ 1 M$ à 10 M$ en un an
    • Des agents de support IA automatisent les tâches répétitives, faisant évoluer les métiers du support client vers un rôle de manager de l’IA
    • Croissance supplémentaire attendue en 2025
  • Services financiers (recherche et analyse)
    • AlphaSense : ARR d’environ 150 M$ à 420 M$ en 2 ans
    • Les insights basés sur l’IA s’imposent comme standard du marché, avec des solutions avancées d’information de marché et de workflow
    • Accent mis sur l’innovation produit et l’investissement technologique, avec une poursuite de la forte croissance en 2025

AI Monetization Threats = Rising Competition + Open-Source Momentum + China’s Rise

Rising Competition = AI Model Releases

  • Depuis l’article fondateur de Google de 2017, « Attention is All You Need », sur les transformers, la première vague d’innovation en IA centrée sur les LLM (grands modèles de langage) a commencé
    • GPT-3 d’OpenAI et Llama-1 de Meta, entre autres, ont démontré le potentiel de capacités de raisonnement généralistes grâce à l’apprentissage de prédiction de texte à grande échelle
  • Cependant, la communication humaine ne se limite pas au texte
    • Images, audio, vidéo, données de capteurs et autres signaux transmettent bien plus richement le contexte des situations réelles
    • Google, Anthropic, xAI et d’autres entreprises étendent les modèles de langage vers le multimodal (traitement de multiples formats de données)
      Évolution des modèles d’IA multimodaux
    • Compréhension et génération en intégrant texte, photos, voix et vidéo dans un même espace vectoriel
    • Pour une même requête, possibilité de s’appuyer simultanément sur des paragraphes et des graphiques, puis de répondre sous forme de résumé vocal ou d’image annotée
    • Une architecture capable de naviguer librement entre tous les formats de données, sans changement de système
  • Exemples d’évolution par étapes clés
    • 2021 OpenAI CLIP : intégration vision + langage
    • 2023 Meta ImageBind, 2024 Chameleon : fusion image, voix et vidéo
    • 2024-2025 GPT-4o, Claude 3, Chameleon : émergence de véritables frontier models multimodaux
  • Effets concrets sur le terrain
    • Un ingénieur terrain vérifie en temps réel, avec la caméra de son smartphone, le diagnostic d’une anomalie sur un équipement
    • Un soignant joint une radio X et génère simultanément une première version structurée du rapport médical
    • Un analyste interroge en une seule fois des graphiques, des transcriptions et des clips audio pour une analyse intégrée
    • Moins de context switching qu’avec les modèles purement textuels, meilleure capture d’information, et innovation des services centrés sur la vision et la voix

Open-Source Model Momentum

  • Le développement des modèles d’IA a d’abord été dominé par l’open source (2012-2018)
    • Sur fond de culture académique et collaborative, modèles, code et données étaient publiés
  • Depuis 2019, avec la commercialisation, les enjeux de sécurité et l’intensification de la concurrence, des modèles fermés (closed source) ont émergé
    • À partir de la publication de GPT-2, les poids des principaux modèles et les données d’entraînement ont cessé d’être rendus publics
    • OpenAI GPT-4, Anthropic Claude et d’autres sont proposés sous forme d’API, avec d’importants investissements en données propriétaires et en capital
    • Ils sont privilégiés par les grandes entreprises, les gouvernements et les consommateurs pour leurs performances, leur facilité d’usage et leur fiabilité
    • En contrepartie, le manque de transparence sur les données d’entraînement, l’architecture des modèles et les méthodes de fine-tuning reste une limite
  • Les modèles open source reviennent aujourd’hui en force
    • Leurs coûts de développement et d’usage sont plus faibles, et leur accessibilité séduit startups, développeurs et monde académique
    • Des plateformes comme Hugging Face permettent de télécharger et d’exploiter facilement des modèles récents comme Meta Llama ou Mistral Mixtral
    • Le développement IA s’étend à nouveau, des immenses laboratoires vers des laboratoires individuels et communautaires
    • L’expérimentation rapide, la collaboration et la participation des communautés accélèrent l’innovation
  • La Chine est devenue, en 2025, le leader mondial du nombre de grands modèles d’IA open source publiés
    • Publication en 2025 de grands modèles comme DeepSeek-R1, Alibaba Qwen-32B et Baidu Ernie 4.5
  • Une différenciation nette entre closed source et open source
    • Open source : moteur de l’IA souveraine, des modèles de langage localisés et de l’innovation communautaire
    • Closed source : avantage sur le marché grand public et dans l’adoption par les grandes entreprises, avec une priorité donnée à l’optimisation et à l’utilisabilité
    • Deux paradigmes s’affrontent — ouverture/vitesse/liberté contre sécurité/optimisation/contrôle — et façonneront l’avenir de l’IA

Rising Performance of Open-Source Models + Falling Token Costs = Explosion of Usage by Developers Using AI

  • Au départ, les modèles closed source comme GPT-4, Claude et Gemini dominaient les marchés grand public et entreprise
    • Grâce à un onboarding simple, une UI/UX soignée et une forte fiabilité, ils bénéficiaient d’un net avantage en perception publique comme en adoption en entreprise
    • Ils offraient aussi sécurité, praticité et notoriété, y compris pour les profils non techniques
  • L’écart de performance des modèles open source se réduit désormais rapidement
    • Llama 3, DeepSeek et d’autres ont atteint un niveau compétitif face aux modèles fermés en raisonnement, en code et en multilingue
    • Ils peuvent être librement téléchargés, fine-tunés et déployés en local, à des coûts bien inférieurs
  • L’adoption des modèles d’IA open source s’accélère côté développeurs
    • Les développeurs privilégient la personnalisation et le rapport coût/performance à une UX très aboutie
    • Les expérimentations innovantes fondées sur des modèles open source se multiplient dans les applications, les agents, les pipelines et d’autres domaines
  • La baisse du prix des tokens et la hausse des performances des modèles open source font exploser le nombre de développeurs qui utilisent l’IA
    • Alors qu’ils dépendaient auparavant fortement d’API fermées, ils peuvent désormais construire et faire évoluer directement leurs systèmes, en local comme dans le cloud
  • La démocratisation auprès du grand public et des grandes entreprises reste encore limitée
    • L’open source reste plus faible en puissance de marque, en UX conviviale et en services managés
    • Mais si l’infrastructure devient plus simple d’usage et que l’écart coût/performance se maintient, une diffusion vers le marché de masse reste possible

La montée en puissance de la Chine

  • Le CTO de Meta, Andrew Bosworth, compare actuellement l’IA à une « course à l’espace » (space race) et estime très hautement notamment les capacités de la Chine
    • Comme la course à l’espace d’autrefois avait une dimension de compétition entre systèmes (vitesse d’innovation, crédibilité mondiale), la compétition autour de l’IA peut elle aussi influencer l’ordre mondial
  • Avec la politique « Made in China 2025 », la Chine a rapidement opéré sa transition d’une manufacture à bas coût vers un pays leader des technologies de pointe
    • En se concentrant sur la robotique, l’électrification, les technologies de l’information et une IA de niveau mondial, elle a rapidement renforcé ses capacités dans des secteurs stratégiques
  • Application de l’IA chinoise aux stratégies militaires et étatiques
    • L’usage de l’IA s’étend à l’ensemble de la sécurité nationale, notamment à la logistique sur le champ de bataille, à la reconnaissance d’objectifs, aux opérations cyber et aux plateformes autonomes d’aide à la décision
    • En 2025, les médias d’État ont aussi mis l’accent sur l’application de l’IA dans les domaines de soutien militaire (hors combat), par exemple les hôpitaux militaires
    • Le ministère de la Science et de la Technologie a clairement présenté l’« innovation indigène » (indigenous innovation) comme une priorité nationale centrale
  • Impact mondial d’un avantage chinois dans l’IA
    • Dans une tribune publiée en 2024, Sam Altman d’OpenAI a averti que « si des régimes autoritaires prennent l’avantage dans l’IA, ils pourraient forcer des entreprises américaines et d’autres pays à partager leurs données, et utiliser l’IA pour surveiller leurs citoyens ou développer des cyberarmes »
  • Intensification de la rivalité technologique pour l’hégémonie entre les États-Unis et la Chine
    • La lutte pour le contrôle ne concerne pas seulement l’IA, mais s’étend aussi aux terres rares, aux semi-conducteurs et aux technologies avancées
    • La Chine conserve sa position de puissance mondiale de l’approvisionnement en terres rares (matériaux clés pour l’électronique avancée, la défense et l’énergie propre), tandis que les États-Unis cherchent à la contenir via le reshoring des semi-conducteurs (relocalisation de la production nationale) et un renforcement de la coopération avec leurs alliés (Japon, Corée du Sud, Pays-Bas, etc.)
    • TSMC à Taïwan constitue un pivot central de la fonderie mondiale de semi-conducteurs, au cœur des calculs stratégiques de Washington comme de Pékin
  • Évolution de l’orientation politique aux États-Unis
    • Après 20 ans de réponse tiède, les deux partis reconnaissent désormais activement les industries de haute technologie comme un « élément central de l’intérêt national »
    • Administration Biden : contrôles à l’exportation ; administration Trump : nationalisme économique et reshoring, entre autres approches
    • Les sénateurs John Cornyn et Mark Warner : « L’innovation américaine dans les semi-conducteurs a soutenu l’ensemble de l’économie, mais le manque de vigilance a permis à des pays concurrents, y compris adverses, de combler leur retard »
  • Importance de la protection de la propriété intellectuelle (IP) technologique américaine
    • OpenAI a déclaré que « des pays concurrents comme la Chine tentent en permanence de faire de la rétro-ingénierie sur les modèles d’IA américains de pointe, et qu’une coopération étroite avec le gouvernement est indispensable »
  • Évolution de la perception des relations sino-américaines
    • Contrairement aux débuts de l’adhésion à l’OMC (années 2000), les États-Unis reconnaissent aujourd’hui clairement que les technologies avancées, comme l’IA, les semi-conducteurs et les minéraux critiques, sont non seulement des actifs économiques et industriels, mais aussi un pilier central de la résilience nationale et de la puissance géopolitique

Public Market Capitalization Leader Tells of Last Thirty Years = Extraordinary USA Momentum…China Rising

  • Au cours des 30 dernières années (1995~2025), parmi les 30 premières entreprises mondiales par capitalisation boursière, seules 6 sont restées présentes en continu
    • Microsoft, Walmart, Exxon Mobil, Procter & Gamble, Johnson & Johnson, Coca-Cola
    • Entreprises nouvellement entrées dans le haut du classement
      • NVIDIA, Apple, Amazon, Alphabet(Google), Saudi Aramco, Meta Platforms(Facebook), Tesla, Broadcom, Berkshire Hathaway, TSMC, JP Morgan Chase, Visa, Eli Lilly, Tencent, Mastercard, Netflix, Costco Wholesale, Oracle, Home Depot, SAP, Bank of America, ICBC, AbbVie, Palantir
    • Répartition par pays en 1995
      • États-Unis : 53 % (16 entreprises sur 30),
      • Japon : 9,
      • Suisse : 3,
      • Royaume-Uni : 2
    • Répartition par pays en 2025
      • États-Unis : 83 % (25 entreprises sur 30)
      • Japon/Suisse/Royaume-Uni : 0
      • Chine 2, Arabie saoudite 1, Taïwan 1, Allemagne 1
  • Au cours des 30 dernières années, parmi les 30 premières entreprises technologiques mondiales (tech companies) par capitalisation boursière, seules 5 sont restées présentes en continu
    • Microsoft, Oracle, Cisco, IBM, AT&T
    • Nouveaux entrants parmi les entreprises technologiques
      • NVIDIA, Apple, Amazon, Alphabet(Google), Meta Platforms(Facebook), Tesla, Broadcom, TSMC, Tencent, Netflix, SAP, Palantir, ASML, Alibaba, Salesforce, T-Mobile, Samsung, China Mobile, Reliance, ServiceNow, Intuitive Surgical, Siemens, Uber, AMD, Intuit
    • Répartition par pays des entreprises technologiques en 1995
      • États-Unis : 53 % (16/30),
      • Japon : 30 % (9/30),
      • Royaume-Uni/Singapour/Hong Kong/Mexique/Malaisie : 1 chacun
    • Répartition par pays des entreprises technologiques en 2025
      • États-Unis : 70 % (21/30)
      • Japon/Royaume-Uni/Singapour/Hong Kong/Mexique/Malaisie : 0
      • Chine 3, Allemagne 2, Taïwan 1, Pays-Bas 1, Corée du Sud 1, Inde 1
    • TSMC à Taïwan : Taïwan ne compte qu’une seule entreprise dans le haut du classement (TSMC), mais au 2e trimestre 2024
      • elle produit 80 à 90 % des semi-conducteurs avancés mondiaux, et plus de 62 % de l’ensemble des semi-conducteurs
  • Un changement immense accompli en une seule génération
    • La diffusion d’Internet a servi de base à l’émergence de nouveaux leaders mondiaux,
    • et la montée de l’IA devrait accélérer au cours des 30 prochaines années des transformations encore plus rapides et plus fondamentales que celles-ci

USA vs. China in Technology = China’s AI Response Time Significantly Faster vs. Internet 1995

  • Leadership des grands modèles de langage (LLM) en IA : les États-Unis et la Chine mènent le rythme du développement mondial de l’IA
    • L’état des lieux des grands systèmes d’IA construits de manière cumulative entre 2017 et 2024 montre que les États-Unis et la Chine sont très nettement en tête
    • En 2024, les États-Unis ont annoncé plus de 150 grands systèmes d’IA, et la Chine en a également présenté plus de 100
    • La France, le Royaume-Uni, le Canada, Hong Kong et l’Allemagne affichent encore un écart important avec les États-Unis et la Chine
  • IA chinoise = rattrapage rapide, DeepSeek R1
    • DeepSeek a annoncé que les capacités chinoises de développement en IA avaient réduit l’écart avec les États-Unis à trois mois (janvier 2025)
    • Le CEO de DeepSeek a souligné que la Chine devait aller au-delà de la simple imitation et miser sur une innovation propre
  • Alibaba Qwen 2.5-Max : revendique de surpasser DeepSeek et OpenAI ChatGPT
    • Qwen2.5-Max a démontré des performances supérieures à DeepSeek V3 et à OpenAI ChatGPT sur divers benchmarks
    • Les performances du modèle continuent de s’améliorer grâce à l’augmentation de l’échelle des données, de la taille du modèle et aux innovations en post-training
  • Baidu Ernie 4.5 Turbo : IA multimodale, coût réduit et hautes performances
    • Une IA multimodale capable de traiter texte, image et vidéo, comparée à un « couteau suisse »
    • Avec 0,8 RMB par million de tokens en entrée et 3,2 RMB en sortie, le coût représente 40 % de celui de DeepSeek V3 et 0,2 % de celui de GPT-4.5
    • Performances équivalentes à GPT-4.1, et supérieures à GPT-4o sur certaines tâches multimodales
  • Performances des LLM : l’écart réel de score entre les États-Unis et la Chine se resserre
    • D’après les résultats de Chatbot Arena de Stanford HAI & LMSYS en février 2025, les États-Unis atteignent 1 385 points et la Chine 1 362, soit des scores très proches
  • IA chinoise : des performances atteintes avec des coûts d’entraînement réduits
    • Selon Epoch AI, des modèles chinois comme DeepSeek V3 ont été lancés à un coût nettement inférieur à GPT-4
  • Bascule de l’entraînement IA vers des semi-conducteurs locaux
    • En raison des restrictions américaines à l’exportation, les clusters locaux de puces IA, notamment ceux de Huawei, se développent rapidement
    • Selon le Financial Times, Huawei fournit désormais à grande échelle des clusters IA destinés aux entreprises technologiques chinoises
  • Chine : une base d’installation de robots industriels au plus haut niveau mondial
    • En 2023, la Chine comptait 276 000 unités, contre 265 000 pour le reste du monde et environ 40 000 pour les États-Unis
  • Conclusion : le rythme de l’innovation IA en Chine est bien plus rapide que celui de l’adoption d’Internet à ses débuts (1995)
    • L’écart avec les États-Unis se réduit rapidement sur les plans technologique, économique et infrastructurel, tandis que la compétition pour le leadership industriel mondial s’intensifie encore

China Consumer AI Usage = DeepSeek Rose Quickly

  • Le marché mondial de l’IA générative se segmente de plus en plus selon les régions, les canaux et les préférences des utilisateurs
    • À l’échelle mondiale, ChatGPT d’OpenAI occupe clairement la première place sur desktop comme sur mobile, mais la concurrence s’intensifie selon les plateformes
    • Claude d’Anthropic et Google Gemini gagnent aussi progressivement des parts de marché, tandis que Grok de xAI a été l’assistant IA à la croissance la plus rapide avec +294 % de visiteurs mensuels entre février et mars 2025
  • En Chine, les modèles d’IA locaux comme DeepSeek dominent
    • ChatGPT est numéro un dans la plupart des pays, mais n’est pas disponible en Russie ni en Chine, laissant le champ libre aux modèles locaux comme DeepSeek
    • Selon le cabinet Roland Berger, les 10 premières applications d’IA en Chine en utilisateurs actifs mensuels sont toutes nationales (DeepSeek, Kimi, Nami AI, ERNIE Bot, etc., avec des dizaines de millions d’utilisateurs)
    • Hors Chine, ChatGPT domine largement à l’échelle mondiale ; en Chine, un marché totalement distinct s’est formé
  • Régulation des plateformes et environnement chinois
    • Facebook, Twitter, Google, YouTube sont inaccessibles en Chine depuis 2010 ou avant
    • Instagram, WhatsApp, Wikipedia, Telegram, Spotify, ainsi que plus récemment ChatGPT, Google Gemini, Claude, Meta AI, Microsoft Copilot, y sont également bloqués
    • Cet environnement réglementaire a favorisé l’émergence de champions locaux de l’IA
  • Différences de perception de l’IA
    • Selon une enquête de Stanford HAI et Ipsos, 83 % des citoyens chinois jugent positivement l’effet net de l’IA (en 2024, soit +5 points par rapport à 2022)
    • Aux États-Unis, seuls 39 % des citoyens ont répondu positivement à la même question, sans changement majeur en deux ans
    • L’approche et l’acceptation de l’IA diffèrent selon les pays du point de vue social et philosophique
  • **Le choix des plateformes dépasse progressivement la performance ou le prix pour toucher à l’identité nationale et culturelle
    • La vraie ligne de fracture n’est plus seulement « qui la développe le mieux ? », mais « comment elle est adoptée et utilisée ? »

AI & Physical World Ramps = Fast + Data-Driven

  • Jusqu’ici, l’accent a surtout été mis sur la diffusion et la monétisation de l’IA dans les logiciels desktop/mobile, mais l’innovation et la monétisation de l’IA dans le monde physique réel évoluent de façon encore plus rapide et spectaculaire
    • L’intelligence est désormais profondément intégrée non seulement dans les applications numériques, mais aussi dans les véhicules, les machines et les systèmes de défense
    • Les flottes de véhicules autonomes comme Waymo et Tesla ne sont plus des projets de laboratoire : elles génèrent réellement des revenus, accumulent des millions de miles de conduite sans conducteur et évoluent rapidement en boucles logicielles de plus en plus sophistiquées
    • Applied Intuition développe des systèmes de véhicules définis par logiciel et des plateformes de simulation indépendants du matériel, afin d’aider les fabricants à appliquer l’intelligence artificielle aussi facilement qu’un composant
    • Dans l’industrie de la défense (Anduril), l’IA transforme le paradigme de la défense en livrant des systèmes autonomes embarquant l’IA sur chaque nœud edge (drones, capteurs, etc.)
    • Dans l’agriculture (Carbon Robotics), l’IA et la computer vision permettent par exemple d’éliminer les mauvaises herbes sans herbicides, illustrant un basculement majeur où les actifs physiques deviennent eux-mêmes des endpoints logiciels
    • Cela suggère que l’IA ne se limite plus à l’écran, mais devient une force cinétique capable d’agir sur le réel
  • Tesla Vertically-Integrated Electric Vehicles
    • De juin 2022 à mars 2025, le kilométrage cumulé en conduite entièrement autonome (Full Self-Driving) a été multiplié par 100
    • Avec l’introduction de la version 12, 330 000 lignes de code C++ ont été remplacées par un réseau neuronal, avec l’adoption d’une architecture IA end-to-end complète
    • L’IA joue un rôle central à toutes les étapes, de la reconnaissance d’objets à la planification de trajectoire en passant par le contrôle du véhicule
    • Tesla pourrait être l’entreprise la plus efficace au monde en inférence IA
  • Waymo Fully-Autonomous Vehicles
    • D’août 2023 à avril 2025, la part de marché du ride-share à San Francisco est passée de 0 % à 27 %
    • Construction d’un système commercial robuste fondé sur une IA multimodale pour la perception, le planning et la prédiction
    • Preuve, sur le marché réel, d’un produit de véhicule autonome commercialement viable
  • Applied Intuition Vehicle Intelligence
    • En 2024, l’entreprise fournit des solutions d’intelligence embarquée pour véhicules à 18 grands OEM automobiles mondiaux
    • Extension des plateformes de simulation et des logiciels de conduite autonome à divers secteurs, dont l’automobile, les camions, la construction et la défense
    • Dans le domaine de la défense, renforcement de la gamme de produits en conduite autonome off-road et en technologies de défense
  • Anduril AI-Enabled Autonomous USA Defense Systems
    • Chiffre d’affaires annuel doublé deux années de suite entre 2022 et 2024, avec un dépassement du milliard de dollars en 2024
    • Utilisation de l’IA et des systèmes autonomes pour soutenir une prise de décision plus rapide et plus précise sur le champ de bataille moderne
    • Innovation des systèmes de sécurité et de défense grâce au déploiement de l’IA sur chaque nœud edge distribué
  • KoBold Metals AI-Driven Mining Exploration
    • Grâce à une technologie de machine prospector fondée sur l’IA, l’entreprise améliore de manière spectaculaire l’efficacité de l’exploration minière, un secteur dont l’efficacité était tombée à son plus bas niveau depuis 1975
    • Combinaison de vastes données géographiques/géophysiques et de modèles de corrélation statistique pour identifier rapidement des cibles d’exploration prometteuses
    • Sécurisation de nouvelles chaînes d’approvisionnement en métaux avec une efficacité plus de deux fois supérieure à la moyenne du secteur
  • Carbon Robotics AI-Driven Agricultural Modernization
    • De janvier 2023 à mai 2025, plus de 230 000 acres ont été désherbés au total, évitant l’utilisation de plus de 100 000 gallons de glyphosate (herbicide)
    • Grâce à des technologies d’IA, de deep learning et de computer vision, l’entreprise élimine au laser les mauvaises herbes autour des cultures
    • Les machines automatisées peuvent traiter 2 acres par heure et éliminer 200 000 mauvaises herbes par jour
  • Halter AI-Driven Intelligent Grazing
    • En 2025, le nombre de nouveaux contrats pour ses colliers connectés pour élevage croît de plus de 150 % par an en moyenne
    • Le pilotage du pâturage par l’IA améliore l’efficacité de l’usage des ressources, la santé des sols et la durabilité
    • Démonstration d’effets majeurs sur la productivité et la réduction carbone, susceptibles de surmonter la lenteur historique de l’adoption technologique dans l’agriculture moderne

Global Internet User Ramps Powered by AI from Get-Go = Growth We Have Not Seen Likes of Before

  • Avec la diffusion de l’internet satellitaire à bas coût, la probabilité augmente rapidement de voir 2,6 milliards de personnes non connectées, soit 32 % de la population mondiale, arriver pour la première fois en ligne
  • Contrairement aux générations précédentes, elles commenceront leur première expérience d’internet avec des fonctions IA intégrées par défaut
  • Au lieu de saisir directement dans une barre de recherche ou de passer par un navigateur traditionnel, elles devraient bientôt dialoguer directement avec l’IA en langage naturel pour obtenir des informations et utiliser divers services technologiques
  • Ces interfaces fondées sur des agents IA peuvent concentrer la valeur de marché entre les mains des acteurs qui possèdent l’interface, plutôt que l’app, et bouleverser la hiérarchie des plateformes existantes
  • À l’avenir, posséder l’interface comptera davantage que posséder la plateforme, et les IA capables de comprendre la langue locale, le contexte et l’intention de l’utilisateur deviendront un avantage concurrentiel clé

New Internet User Growth = Enabled by AI + Satellites

  • Orbital / Satellite Launch Market Share, Global = SpaceX Rising
    • Depuis 2008, une renaissance des lancements spatiaux commerciaux et étatiques a commencé, et SpaceX représente une part importante du nombre annuel de lancements
    • Les États-Unis (hors SpaceX), la Chine et la Russie affichent eux aussi leur propre dynamique de croissance, mais la progression fulgurante de SpaceX se distingue particulièrement
    • De la Guerre froide jusqu’à la fin des années 1990, les lancements étaient dominés par les États ; ces dernières années, la tendance est à une hausse des lancements portés par le secteur privé
  • SpaceX Starlink @ 5MM+ Subscribers = +202% Annual Growth Over 3.2 Years
    • Starlink est passé d’environ 100 000 abonnés en 2021 à plus de 5 millions en 2024
    • Avec un taux de croissance annuel moyen de 202 %, le service étend rapidement sa base mondiale d’utilisateurs internet
  • SpaceX Starlink Ecosystem = Coverage Expanding Globally
    • En 2025, Starlink a étendu sa zone de service à l’Amérique du Nord, l’Amérique du Sud, l’Europe, l’Océanie, une partie de l’Afrique et les principales régions d’Asie
    • Les pays encore non desservis restent limités, comme la Chine, la Russie et l’Iran
  • Starlink = Unlocking Previously-Inaccessible Internet Access in AI Era
    • Coco, Monterrey, Mexico: fourniture d’un internet haut débit et fiable à une zone rurale du Mexique, avec une extension de l’accès numérique via le WiFi communautaire
    • Chile School District: fourniture d’un internet haut débit permettant la connexion simultanée des 36 ordinateurs d’écoles chiliennes, transformant l’environnement d’apprentissage pour les élèves comme pour les enseignants
    • Brightline Trains, USA: fourniture d’un internet satellitaire stable dans le train à grande vitesse américain, améliorant l’expérience passager et l’efficacité opérationnelle
    • Seaspan Corporation, Global: déploiement d’un internet satellitaire pour un armateur mondial, permettant de transformer les navires en bureaux distants, d’améliorer la sécurité des équipages et l’efficacité opérationnelle, et de rendre possibles des solutions auparavant irréalisables

AI & Work Evolution = Real + Rapid

  • Changement fondamental de la nature du travail sous l’effet de l’adoption de l’IA
    • En plus de l’automatisation physique comme les robots et les drones, l’automatisation cognitive se diffuse rapidement
    • Les systèmes d’IA acquièrent des capacités de raisonnement, de création et de résolution de problèmes, élargissant ainsi leur champ d’application au travail
  • Vitesse de progression des capacités cognitives de l’IA
    • En trois ans depuis la mise à disposition de ChatGPT (novembre 2022), l’IA est passée d’un niveau lycéen à une capacité de raisonnement de niveau doctorat
    • Les métiers fondés sur des règles et du jugement, reposant sur de vastes données structurées, basculent vers les points forts de l’IA
  • Évolution de l’unité du travail
    • Le travail, jusqu’ici centré sur l’humain, pourrait basculer vers une logique fondée sur la puissance de calcul des datacenters et des modèles d’IA
    • Une époque arrive où l’infrastructure IA détermine l’offre et la qualité de certaines formes de travail
  • Avenir fondé sur les agents et rôle de l’humain
    • Certains estiment que les agents IA remplaceront les emplois de cols blancs
    • Mais il faut tenir compte d’un schéma historique où l’amélioration de la productivité et de l’efficacité s’est accompagnée de l’apparition de nouveaux métiers humains
    • Même dans une société entièrement centrée sur les agents, des rôles humains comme la supervision, l’entraînement et l’encadrement subsisteront
  • Structure future du travail et changements sociaux
    • À l’image du RLHF (apprentissage par renforcement à partir de retours humains), les humains se déplacent vers des rôles de formation et de réglage fin des performances de l’IA et des robots
    • Historiquement, les transformations des modes de travail ont toujours été récurrentes, et l’IA est elle aussi une technologie qui accélère la productivité et l’évolution du travail

Summary

  • Comme il est difficile d’imaginer une vie sans Internet, il deviendra sans doute bientôt impossible d’imaginer un monde sans IA
    • L’IA s’impose rapidement comme une infrastructure clé dans l’ensemble des secteurs : support client, développement logiciel, science, éducation, industrie, etc.
  • Facteurs qui accélèrent la démocratisation de l’IA
    • La diffusion mondiale d’outils d’IA multimodaux comme ChatGPT, la baisse du coût du raisonnement et la sortie de nombreux modèles en favorisent l’essor
    • Du développeur solo aux grands groupes, l’accès et l’expérimentation deviennent plus simples, ce qui accélère la diffusion de l’innovation
  • Infrastructure technologique et investissements
    • Forte hausse des dépenses d’investissement des grands acteurs du cloud, des semi-conducteurs et des hyperscalers
    • La frontière entre physique et numérique devient de plus en plus floue, des puces aux datacenters, en passant par les réseaux et les systèmes énergétiques
  • Compétition stratégique États-Unis–Chine et leadership mondial dans l’IA
    • Les États-Unis sont en tête sur l’innovation des modèles, les puces sur mesure et l’infrastructure cloud, mais la Chine progresse elle aussi rapidement grâce à l’open source, aux infrastructures et au soutien public
    • Les deux pays considèrent l’IA comme un levier central de croissance économique et d’influence géopolitique
  • Évolution des plateformes et des interfaces
    • L’IA évolue au-delà de l’écosystème applicatif existant vers des interfaces conversationnelles fondées sur des agents
    • Grâce notamment à l’Internet par satellite, il est probable que les nouveaux internautes commencent directement par une expérience native de l’IA
  • Transformation des emplois et des modes de travail
    • L’adoption de l’IA s’accélère au travail, avec une transition progressive de l’unité du travail de l’humain vers la puissance de calcul et l’IA
    • De plus en plus de personnes travaillent avec l’IA, et la tendance à voir l’IA réorganiser l’environnement de travail se confirme nettement
  • Combinaison entre contexte international et technologie
    • Les flux d’information et de capitaux, la militarisation des technologies et l’approfondissement de l’opposition démocratie-autoritarisme renforcent l’incertitude
    • Mais l’innovation reste au cœur de la compétitivité des nations, d’où l’importance, selon le rapport, d’une exécution rapide et d’une stratégie d’alliances
  • Conclusion
    • Le moment de jeu de l’IA est arrivé, et il devient de plus en plus intense
    • Le génie ne retournera pas dans sa lampe (le point de non-retour a été franchi)

1 commentaires