4 points par GN⁺ 2026-03-31 | 2 commentaires | Partager sur WhatsApp
  • La bulle d’investissement du secteur de l’IA est déjà formée et pourrait éclater plus vite que prévu en raison de l’écart entre productivité et rentabilité
  • Les géants de la tech se livrent à une course aux dépenses d’investissement d’une ampleur inédite pour préserver leur avantage concurrentiel, mais les montants réellement engagés pourraient au final diminuer
  • La hausse des coûts énergétiques, les variations des prix de la RAM et le blocage des capitaux du Moyen-Orient accentuent la pression financière sur les laboratoires d’IA, dont certains réagissent déjà par une hausse des tarifs utilisateurs
  • OpenAI atteint les limites de sa monétisation, ce qui alimente les spéculations sur l’introduction de publicité et sur une éventuelle vente, tandis qu’une tentative de rachat par Microsoft s’accompagnerait d’un risque de fragilisation de la justification boursière du groupe
  • Cette dynamique pourrait entraîner une baisse des valorisations de marché, un resserrement du financement VC et une diminution de la demande en datacenters et GPU, avec un risque élevé de voir se reproduire le cycle boom-récession dans l’ensemble du secteur de l’IA

Signes avant-coureurs de l’éclatement de la bulle de l’IA

  • Le déclencheur de l’effondrement du secteur de l’IA est déjà en place et pourrait survenir plus tôt que prévu
    • La technologie IA elle-même continuera d’exister, mais gain de productivité et rentabilité des investissements sont deux choses distinctes
    • Une technologie peut améliorer l’efficacité de la société tout en perdant de son attrait en tant qu’actif d’investissement

La stratégie des big tech : non pas la victoire, mais une course aux dépenses

  • Les entreprises du Magnificent 7 prévoient des dépenses d’investissement (capex) records, principalement comme mesure défensive pour se différencier de leurs concurrents et des laboratoires d’IA
    • Par exemple, si une entreprise engage 50 milliards de dollars, OpenAI et Anthropic doivent lever 100 milliards pour rester dans la course
    • Plus les montants augmentent, moins il existe de fonds capables de les absorber, et les capitaux du Moyen-Orient sont en particulier difficiles d’accès pour des raisons géopolitiques
  • Pour cette raison, la mise en Bourse des entreprises d’IA s’accélère et devient un levier central pour maintenir les flux de capitaux
  • Google occupe une position favorable grâce à sa capacité à gérer ses ressources sur le long terme
    • L’entreprise peut ne pas dépenser immédiatement le capex annoncé et l’injecter progressivement jusqu’à ce que ses concurrents se retrouvent à court de financement
    • Une fois les concurrents contraints d’abandonner, elle peut réduire ses dépenses et dominer le marché
    • La capitalisation boursière d’Alphabet avoisine les 2 000 milliards de dollars, soit environ 10 fois celle du plus grand groupe d’armement
  • En conséquence, le capex réel des entreprises du Mag 7, en particulier celui de Google, pourrait être inférieur aux attentes, ce qui pourrait être perçu positivement par les investisseurs
  • Apple explore une approche consistant non pas à concurrencer directement, mais à connecter à Siri des modèles d’IA externes payants ; Amazon répartit son risque via son investissement dans Anthropic, tandis que Meta poursuit ses dépenses massives

Facteurs déclencheurs : hausse des coûts et resserrement du financement

  • Les laboratoires d’IA font face à une combinaison de vents contraires : envolée des coûts énergétiques, blocage des capitaux du Moyen-Orient, crainte d’une hausse des taux et forte baisse des prix de la RAM
    • La baisse des prix de la RAM s’explique par la technologie TurboQuant AI de Google, grâce à laquelle les modèles de nouvelle génération nécessitent moins de mémoire, alors que les laboratoires ont déjà signé des contrats d’achat massifs à des prix élevés
  • Anthropic ajuste ses limites d’usage pour réduire ses coûts et accroître ses revenus ; si les financements se tarissent, il deviendra inévitable de répercuter les coûts sur les utilisateurs
    • Selon un rapport indépendant, le coût réel d’utilisation des modèles Claude atteindrait environ 5 fois le prix de l’abonnement, et la rentabilité reste incertaine
    • Une hausse des prix peut entraîner une baisse de la demande, ce qui fragilise le récit de croissance
    • Même si le chiffre d’affaires augmente, une croissance sans bénéfices accélère la consommation de cash
  • Les grands groupes du cloud peuvent proposer les fonctions d’IA comme produit d’appel à perte (loss leader) dans leurs bundles, ce qui affaiblit la compétitivité-prix des laboratoires indépendants
  • Les offres Claude Max et Max 5x (100 et 200 dollars par mois respectivement) ne permettent pas de paiement annuel, ce qui laisse entrevoir de futures hausses de prix

OpenAI face à ses limites de monétisation

  • OpenAI peine à générer des revenus et en vient à une solution de dernier recours : introduire de la publicité dans ChatGPT
    • Une approche que le CEO Sam Altman avait autrefois qualifiée de « dernier choix »
    • À l’inverse, Anthropic assure une rentabilité plus élevée auprès des clients entreprises et du marché des développeurs
  • La fonction shopping a échoué, et Sora, l’application de vidéos courtes, a été fermée pour réduire les coûts
  • L’idée d’une vente d’OpenAI à court terme est évoquée
    • L’acquéreur le plus probable serait Microsoft, qui détient déjà une part importante du capital
    • Mais un rachat d’OpenAI nécessiterait 613 milliards de dollars, soit environ 22 % de la capitalisation boursière de Microsoft, et l’approbation des actionnaires reste incertaine
  • Même si Microsoft allait au bout de l’opération, il existerait un risque de fragilisation de la justification boursière de son action si le récit de croissance de l’IA s’effondrait
    • Si OpenAI échoue, Microsoft perdrait un client majeur pour son activité cloud, et l’IA qu’il a lui-même soutenue pourrait aussi cannibaliser des produits clés comme GitHub

Impact sur le marché et sur les individus

  • Les difficultés de financement des grands laboratoires d’IA peuvent frapper directement les états financiers et les perspectives de croissance des entreprises cotées
    • Cela pourrait conduire à une baisse générale des valorisations, à un ralentissement des fusions-acquisitions et à un resserrement du financement VC
    • Un cycle de contraction de l’investissement comparable à celui de 2022 pourrait réapparaître
  • Les fonds de pension et les investissements dans les datacenters seraient également touchés
    • Si l’entraînement de nouveaux modèles s’interrompt, la demande de GPU diminuera, provoquant une surcapacité d’équipement
    • Certains GPU pourraient ne jamais être livrés, voire ne jamais être produits
    • Cela pourrait porter un coup sévère à Nvidia
  • Même si les datacenters entrent en service, ils pourraient devoir fournir leurs services à des tarifs plus bas que prévu, une situation où les utilisateurs de l’IA en profitent mais les opérateurs subissent les pertes
  • Les datacenters sont généralement considérés comme des actifs sûrs et financés par des prêts bancaires, mais une baisse de leur valeur pourrait entraîner la constatation de pertes par les banques et une réduction du crédit
    • Certaines banques pourraient subir des pressions à la liquidation comme en 2023
  • Si à cela s’ajoutent des perturbations de la production à Taïwan ou des désorganisations de la chaîne d’approvisionnement, la situation pourrait encore empirer
  • Il reste toutefois possible que la demande pour les modèles dépasse les attentes et compense tous ces problèmes
    • Mais la plupart des innovations technologiques ont connu des cycles de boom et de récession, et l’IA pourrait bien ne pas faire exception

2 commentaires

 
sea715 2026-03-31

C’est donc le billet annuel sur la WWE, comme d’habitude...

 
GN⁺ 2026-03-31
Avis sur Hacker News
  • L’article affirme que « le prix de la RAM est en train de s’effondrer », mais en réalité ce n’est pas le cas
    Si l’on regarde l’évolution du prix de la mémoire sur PCPartPicker, il n’y a pas encore de baisse, et l’article de Google sur TurboQuant ne mentionne que la possibilité de réduire les besoins en RAM
    Je trouve irresponsable de construire tout l’argumentaire sur cette base. Ce n’est pas différent d’un LLM qui cite des liens hors sujet

    • Je pense que c’est déjà tranché. Si l’on regarde le paradoxe de Jevons, même quand l’efficacité augmente, on finit par en consommer davantage
    • Il est très probable que les grands labos utilisent depuis longtemps des techniques comme TurboQuant
      L’annonce de Google n’a rien de nouveau, et TurboQuant lui-même est une technologie vieille d’un an
    • D’accord. Cela dit, les prix de la RAM grand public sont répercutés plus tard que les prix commerciaux
      Même si les prix côté entreprise baissent, l’effet n’arrive sur le marché grand public que bien plus tard
    • Le problème des LLM qui citent des liens hors sujet, les humains le faisaient déjà depuis longtemps
      J’ai moi-même vu ce genre de cas plusieurs fois
    • L’article cité ne parlait pas du prix de la RAM, mais de la baisse du cours des actions des entreprises de la mémoire
      En pratique, c’est bien une baisse des actions, comme l’indique l’article du FT
  • Il est surprenant que le boom de l’IA soit à ce point polarisé
    La technologie représente clairement un saut progressif réel, mais personne ne sait où cela va mener
    Le coût de fourniture des tokens est déjà à un niveau rentable depuis plus d’un an ; le problème, c’est la R&D et les investissements en infrastructures
    Les datacenters restent toujours dans une situation où la demande dépasse l’offre. Ce n’est pas une structure maintenue comme autrefois par des salaires irréalistes, c’est un marché où la demande existe réellement

    • La demande de tokens augmente de façon explosive
      Ce n’est pas, comme autrefois, une logique de « remplacer les humains », mais la création d’un nouveau marché
      Cela dit, si la qualité ne suit pas, cela peut devenir une bulle
    • On dit que les tokens sont rentables, mais j’aimerais voir les chiffres précis qui le montrent
    • D’après OpenRouter, la demande de tokens croît de 10 % par semaine. C’est absurdement rapide
    • J’ai du mal avec l’expression « salaires d’ingénieurs excessifs ». On ne voit pas bien sur quel critère cela repose
    • La fourniture de tokens serait rentable ? La plupart des entreprises sont encore déficitaires. Le chiffre d’affaires et le bénéfice, ce n’est pas la même chose
  • Présenter l’introduction de la publicité chez OpenAI comme un « échec de la monétisation » est inexact
    La publicité n’est qu’une stratégie pour la version gratuite, elle n’est pas incluse dans les offres payantes
    Qu’une startup soit déficitaire en phase de croissance est un phénomène classique du cycle VC
    L’inference est au contraire très rentable, et investir dans la R&D va dans la bonne direction

    • Il est vrai que ChatGPT a introduit de la publicité, mais cela pourrait commencer dans le palier gratuit puis s’étendre au payant
      La TV et YouTube ont commencé comme ça
    • Il y a bien de la publicité, et compte tenu du fait que Sam a dit que c’était un « dernier recours », cela a un sens
      Une structure maintenue par des subventions du capital-risque n’est pas viable à long terme
    • Alors pourquoi OpenAI affiche-t-il encore des pertes massives ? C’est une vraie question
    • Il est difficile d’être optimiste aussi pour des concurrents comme DeepSeek ou z.ai. On en parle simplement moins
    • Dire que « les pertes sont normales pendant la croissance » a ses limites
      Quand on est déjà une entreprise pesant plusieurs milliards de dollars, il faut à ce stade basculer vers la rentabilité
      L’exploitation des GPU elle-même est structurellement déficitaire, au point que même les datacenters ont du mal à dégager des profits
  • L’usage des LLM a explosé, mais où est l’impact social ?
    Je m’attendais à voir une hausse visible sur l’App Store, Steam, GitHub, PyPI, etc.
    On espérait des gains de productivité en entreprise, de meilleurs résultats éducatifs, voire même une hausse du PIB, mais rien n’est vraiment perceptible
    Personnellement, je trouve que c’est un outil utile, mais ses effets macroéconomiques ne se voient pas encore

    • La programmation ne représente que 2 à 10 % de toute la production logicielle
      L’IA a accéléré le codage, mais les phases de planification, gestion et feedback sont devenues au contraire plus confuses
    • La technologie en est encore à ses débuts, et il faut du temps avant que les projets arrivent à terme
      Je développe moi-même un jeu indé, et grâce à l’IA ma vitesse a été multipliée par 2 à 4, mais cela prendra quand même encore un an
    • J’ai été impressionné de voir le caractère « ⸻ ». C’est bien un vrai humain !
  • L’affirmation selon laquelle « la fourniture de tokens est rentable » relève surtout d’une comptabilité maquillée
    En réalité, le vrai problème, c’est le coût d’entraînement des modèles de nouvelle génération
    Des fournisseurs indépendants proposent déjà des modèles comparables à des prix bien plus bas

    • Pourtant, si l’on regarde les documents financiers d’OpenAI, même l’inference est déficitaire
      Même quand les revenus augmentent, les coûts montent proportionnellement, donc il n’y a pas d’économies d’échelle
    • J’en ai aussi parlé dans le billet que j’ai écrit, et l’affirmation de Cursor est exagérée
      Si l’on se base sur OpenRouter, on est à un niveau de marge de 90 %
    • En pratique, ils distribuent des subventions pour acquérir des utilisateurs
      Si l’on ne regarde que les simples utilisateurs de chat, cela peut être rentable, mais ce n’est pas le cas pour la majeure partie de l’usage total
    • Calculer la rentabilité en excluant les coûts d’entraînement, ce n’est que de la comptabilité créative
      Le prix des abonnements est bien plus bas que celui de l’API, donc il faudra forcément l’augmenter ou les supprimer
      Il est difficile de faire confiance aux propos des dirigeants d’entreprises d’IA
  • Je pense que le marché de l’IA n’est pas un marché où le gagnant rafle tout
    ChatGPT a une forte notoriété de marque, mais le coût de changement entre modèles est presque nul
    Les ingénieurs utilisent déjà plusieurs modèles en parallèle, et si les prix montent ils changeront immédiatement
    Il se peut même que, pour les entreprises, acheter directement des GPU et faire de l’auto-hébergement revienne moins cher

    • Dans une logique de facturation au token, il n’y a aucune raison de se retrouver enfermé dans un modèle particulier
      Il faut exploiter les forces et faiblesses de chaque modèle selon le contexte
    • Il n’existe pas encore de modèle capable d’automatiser complètement l’usage quotidien d’un PC
      Quand ce marché s’ouvrira, l’opportunité sera bien plus grande qu’aujourd’hui
    • Si Google a gagné, c’est parce que ses concurrents étaient mauvais
      Aujourd’hui, l’écart de qualité entre les modèles est faible, donc la plupart des utilisateurs utiliseront plusieurs modèles en parallèle
  • Dire que les produits Microsoft sont « médiocres » est excessif
    Des produits comme Word sont le résultat de décennies de travail des meilleurs ingénieurs

    • Mais le fait que Word mette plus de 20 secondes à se lancer sur un PC moderne reste un problème
      Et l’imposition de fonctionnalités IA est pénible
    • Plus que « médiocre », feature creep est une expression plus juste
      En pratique, il est rare d’avoir réellement besoin d’utiliser Word
    • Même si l’utilisateur ne peut pas le fabriquer lui-même, il a le droit de critiquer. C’est le principe même des critiques et des tests
    • L’IA de Microsoft est actuellement décevante, et la marque Copilot suscite aussi beaucoup de rejet
      Office pourrait durer longtemps même en changeant seulement de nom
    • L’état de GitHub et de Windows 11 est clairement insuffisant en matière de qualité
  • Comme on dit, « l’histoire ne se répète pas » ; cette fois, il est possible qu’il n’y ait pas d’hiver de l’IA
    Contrairement aux années 1990, il n’existe aujourd’hui aucune technologie de remplacement, et l’IA représente un saut technologique évident

    • C’était déjà mentionné au début de l’article.
      L’idée clé est que « l’IA va durer, mais le retour sur investissement est une autre question »
    • La bulle internet a bien éclaté, mais au final ce sont les entreprises de l’internet qui ont dominé le marché
      Il en a été de même pour la bulle ferroviaire — la technologie reste, seule la bulle disparaît
    • La phrase « l’histoire ne se répète pas » arrive toujours juste avant qu’elle ne se répète
  • La situation des datacenters est chaotique
    La plupart des centres annoncés en 2024 ne sont toujours pas terminés,
    et le rythme de déploiement est bien plus lent que la production de Nvidia
    Beaucoup d’équipements ne peuvent même pas être mis en service faute d’électricité disponible, et du « dark silicon » s’accumule
    Pendant ce temps, les consommateurs ne peuvent toujours pas obtenir des produits à des prix raisonnables

  • Le fait que les « Magnificent 7 » augmentent massivement leurs dépenses d’investissement (capex) est une mesure défensive
    Mais l’auteur n’explique pas pourquoi cela constituerait une menace pour OpenAI ou Anthropic
    Cela ressemble simplement à un texte superficiel écrit pour être partagé

    • S’ils veulent rester compétitifs, cela finira de toute façon par être une bataille de puissance financière
      Cela dit, à long terme, il n’est pas certain que cela soit nécessaire à ce point