L’IA ralentit
(wheresyoured.at)- Pour justifier les investissements dans les data centers et les engagements en capacité de calcul, l’infrastructure d’IA générative doit générer plus de 2 000 milliards de dollars de revenus annuels liés au calcul IA d’ici 2030
- Les 190 GW de data centers prévus représentent 9 500 à 15 000 milliards de dollars en appliquant un coût de 80 à 100 milliards de dollars par GW, et leur concrétisation nécessiterait l’émission annuelle de 500 à 1 000 milliards de dollars de dette de data center
- OpenAI devrait avoir brûlé au moins 852 milliards de dollars d’ici fin 2030, tandis qu’Anthropic devra atteindre un objectif de 174 milliards de dollars de chiffre d’affaires annuel en 2029 pour assumer ses engagements de calcul
- Depuis le passage à une facturation basée sur les tokens, les entreprises peinent à avoir de la visibilité sur leurs dépenses IA et à mesurer le ROI, et Uber, T-Mobile et Brex ont fixé des plafonds de dépenses en tokens par employé
- Actuellement, 89 % des revenus des startups IA sont concentrés chez OpenAI et Anthropic, si bien qu’il faudra au minimum 250 milliards de dollars supplémentaires de demande annuelle en calcul IA pour justifier l’ampleur des capacités en cours de construction
L’IA ne peut pas se permettre de ralentir — plus de 3 000 milliards de dollars de revenus nécessaires d’ici fin 2030
- En appliquant directement les données de Sightline Climate, la capacité planifiée des data centers atteint 190 GW et, en reprenant la déclaration de Jensen Huang sur un coût de 80 à 100 milliards de dollars par GW, le coût total est estimé entre 9 500 et 15 000 milliards de dollars
- L’affirmation de Bloomberg sur une construction de data centers à hauteur de 3 000 milliards de dollars ne correspond pas à ce calcul, et les fonds nécessaires devront être levés quelque part
- Un article du Financial Times estimait que les banques pourraient ne pas être en mesure d’absorber la dette liée aux data centers, et que les émissions annuelles, actuellement autour de 250 milliards de dollars, devraient grimper à 500 milliards voire 1 000 milliards de dollars pour permettre la construction réelle
- NVIDIA prévoit 1 000 milliards de dollars de revenus d’ici fin 2027 et, 54 % de ses revenus provenant de trois clients, ses revenus futurs dépendront d’un petit nombre de clients et de la capacité de leurs contreparties à lever de la dette
- La cession de 85 milliards de dollars d’actions par Google et le projet de Meta de vendre pour des dizaines de milliards de dollars d’actions sont liés à un contexte où le financement par la dette devient plus difficile pour les hyperscalers
Les engagements de calcul d’OpenAI et d’Anthropic
- Les engagements d’Anthropic en calcul et en puces atteignent 330 milliards de dollars auprès de Google, Amazon et Microsoft, 30 milliards auprès de CoreWeave et 15 milliards auprès de SpaceX
- Pour couvrir ce coût de calcul, Anthropic devra atteindre son objectif de 174 milliards de dollars de chiffre d’affaires annuel en 2029
- Anthropic a levé 95 milliards de dollars lors des tours de février, avril et mai, mais ces fonds et les flux de trésorerie ne suffiront pas à couvrir les coûts, ce qui imposera de lever au moins 200 milliards de dollars supplémentaires l’année suivante
- OpenAI devrait brûler au moins 852 milliards de dollars d’ici fin 2030 et a contracté plus de 770 milliards de dollars d’engagements de calcul auprès de Microsoft, Amazon, CoreWeave, Cerebras et Oracle
- La levée de 122 milliards de dollars d’OpenAI en mars ne suffit pas à couvrir les coûts, et au moins 250 milliards de dollars de financements supplémentaires seront nécessaires d’ici la fin de l’année
Calcul des revenus des data centers et risque pour Oracle
- L’IA générative et le calcul IA doivent générer plus de 2 000 milliards de dollars de revenus annuels d’ici 2030, faute de quoi les dépenses d’investissement des data centers et le paiement des engagements d’Anthropic et d’OpenAI ne tiendront pas
- En appliquant un PUE de 1,35 à 190 GW de data centers, la charge IT utile tombe à environ 140 GW, ce qui exige 1 750 milliards de dollars de revenus annuels sur la base d’une facturation de 12,5 millions de dollars par MW
- Même si seulement la moitié de la capacité prévue est construite, il faudrait encore 875 milliards de dollars de revenus annuels pour éviter que les data centers ne se retrouvent à court d’argent
- OpenAI et Anthropic prévoient respectivement 184 et 174 milliards de dollars de revenus en 2029, soit seulement 358 milliards de dollars au total
- Si OpenAI ne peut pas ou ne veut pas assumer le calcul fourni par Oracle, Oracle pourrait se retrouver à court de liquidités, alors que l’entreprise dépense 340 à 700 milliards de dollars pour des data centers totalisant 7,1 GW dédiés à OpenAI
Les dépenses actuelles en IA sont insuffisantes
- Le projet de Salesforce de dépenser 300 millions de dollars chez Anthropic en 2026 est très loin de l’échelle requise
- La somme de la demande actuelle en calcul de toutes les entreprises IA dans le monde n’atteint pas 100 milliards de dollars, alors qu’il en faudra 10 fois plus en 2030
- Selon The Information, la concentration des revenus des startups IA chez OpenAI et Anthropic atteint 89 %, comme indiqué par {p:89}
- Le rythme annualisé de 37 milliards de dollars de Microsoft en IA repose principalement sur le calcul OpenAI, et le CEO de Microsoft AI, Mustafa Suleyman, estime que les modèles d’Anthropic sont trop chers et cherche à ramener leur usage à zéro chez Microsoft
- Même si Anthropic et OpenAI consommaient 500 milliards de dollars de calcul par an, il faudrait encore plus de 250 milliards de dollars de revenus annuels supplémentaires en calcul pour justifier la construction des data centers
Facturation au token et incertitude sur le ROI
- Le coût et le retour sur investissement de tâches IA spécifiques ne sont pas mesurables, et les entreprises ont étendu leur adoption de l’IA sans mesurer réellement les résultats produits
- Anthropic et OpenAI ont basculé leurs clients vers une facturation basée sur les tokens au premier trimestre 2026, et en l’espace de deux à trois mois l’incertitude sur les coûts IA et le ROI est devenue un thème récurrent dans les grands médias économiques
- Dans une enquête KPMG citée par le Wall Street Journal, la visibilité sur les coûts IA se répartit entre 26 % de vision globale, 50 % de vision partielle et 22 % d’absence de visibilité ou de connaissance seulement après facturation, comme dans
- Une entreprise, faute de contrôle des dépenses, a dépensé 500 millions de dollars en un mois sur les modèles d’Anthropic, et Uber a épuisé en un seul trimestre son budget annuel de tokens
- Uber limite les dépenses IA à 1 500 dollars par utilisateur et par mois, T-Mobile provisoirement à 2 000 dollars par utilisateur et par mois, et Brex à 500 dollars par semaine pour les ingénieurs et 5 dollars par semaine pour les non-ingénieurs
Agents de code, boucles et problème des résultats produits
- Boris Cherny, responsable de Claude Code, et Peter Steinberger, évangéliste d’OpenClaw détenu par OpenAI, demandent aux utilisateurs de concevoir des boucles pour les agents
- Les boucles consistent à permettre à un LLM de continuer à agir pendant la durée souhaitée sans que l’utilisateur n’ait à ajouter de prompt supplémentaire
- Avec les abonnements grand public, le coût des erreurs du modèle est masqué derrière 20, 100 ou 200 dollars par mois, mais quand l’utilisateur paie le coût réel, celui de l’échec apparaît tel quel
- Cela rejoint les recherches selon lesquelles plus un LLM raisonne, plus les hallucinations augmentent, tandis que l’approche par agents laisse le LLM élaborer lui-même son plan
- Notion a bloqué l’accès à Anthropic pendant plusieurs heures après une interruption de service d’Anthropic, et nombre d’applications produites par les outils de codage IA ne sont au final que du slopware inutile et peu sûr
La métaphore de l’araignée géante en métal
- L’araignée géante en métal est un appareil à 1 million de dollars, qui coûte 40 000 dollars de carburant à chaque utilisation, mais peut saisir des objets ou préparer le dîner
- Le même appareil peut aussi bien sortir précisément un Diet Coke du réfrigérateur que percer un trou dans ce même réfrigérateur, et l’utilisateur doit payer 40 000 dollars quel que soit le résultat
- Grâce aux subventions, le grand public ne subit que ponctuellement les comportements destructeurs, mais les entreprises supportent le coût réel et le fabricant perd des milliards chaque année en entraînement et en maintenance
- Les nouvelles fonctionnalités élargissent la liste de ce que l’appareil est censé pouvoir faire, mais chaque ajout de fonction coûte des centaines de millions de dollars, sans qu’il soit toujours clair qu’il ait réellement appris quelque chose de nouveau
- Même s’il existe une étude montrant une hausse de la capacité à accomplir à 50 % des tâches d’une certaine longueur, l’araignée de la métaphore peut encore se tromper à tout moment et agir sans que l’utilisateur le lui ait demandé
L’économie circulaire de l’IA et la demande réelle pour les produits
- L’IA générative a un coût d’exécution élevé, les principaux laboratoires d’IA n’ont pas de trajectoire vers la rentabilité, et le coût comme le ROI des tâches fondées sur des LLM restent impossibles à mesurer
- Les projets IA peuvent accroître les coûts d’exploitation de 10 % à 100 %, et contrairement à la promesse d’une baisse des coûts pour les opérateurs de services IA comme pour leurs clients, les dépenses ont augmenté
- Ces coûts élevés entretiennent une structure où les laboratoires d’IA envoient de l’argent à leurs partenaires hyperscalers de calcul, argent qui recircule ensuite vers les laboratoires et la demande en GPU NVIDIA
- Si OpenAI ou Anthropic cherchent la rentabilité ou la soutenabilité, la demande en calcul IA diminuera, tout comme la demande pour Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure et les GPU NVIDIA
- Pour être à la hauteur des engagements et des perspectives actuels, l’ensemble de la stack IA doit être multiplié par 10, avec 250 milliards de dollars supplémentaires de demande annuelle en calcul IA et au moins deux entreprises supplémentaires de la taille d’OpenAI ou d’Anthropic
2 commentaires
L’API n’a jamais cessé d’être facturée au token...
Commentaires Hacker News
Aujourd’hui, Apple a dévoilé ses fonctionnalités IA remaniées et, si l’on en croit plusieurs articles, Apple ne paierait à Google qu’environ 1 milliard de dollars par an pour les faire tourner
Cela revient en pratique à une simple licence de propriété intellectuelle, et Google semble considérer comme acceptable de céder pour ce montant le droit d’exploiter et de distiller son propre modèle
Même si les revenus grand public ne représentent qu’une partie du puzzle, on peut se demander pourquoi les utilisateurs de Mac ou d’iPhone auraient besoin de payer pour ChatGPT si la nouvelle IA d’Apple répond déjà à leurs besoins
Google va lui aussi intégrer des outils comparables dans les téléphones et continuer à proposer des fonctions IA dans la recherche, donc je ne vois pas où est la preuve qu’après l’arrivée de la technologie d’Apple, l’IA grand public vaut pour Anthropic ou OpenAI bien plus de 1 milliard de dollars par an
Même si OpenAI signait un accord pour être intégré aux téléphones Samsung et que Samsung était 10 fois plus désespéré qu’Apple, cela ferait environ 10 milliards de dollars par an ; or si les prévisions de revenus grand public d’OpenAI pour 2026 sont de 14 à 15 milliards de dollars, alors même en les atteignant, cela semble difficile à maintenir une fois que des fonctions intégrées utiles existeront pour les utilisateurs d’iPhone
Ed Zitron ressemble davantage à un agitateur bruyant à l’anglaise, mais il semble globalement dire des choses justes
Même avec un bouton Copilot sur Windows, les gens utilisent GPT ; Microsoft Edge n’est pas le navigateur le plus populaire sur Windows ; et Instagram Threads n’a pas vraiment porté un grand coup à TikTok
La question est posée à l’envers. Les gens ont une forte préférence pour ce qu’ils aiment déjà utiliser et veulent continuer à l’utiliser
Il n’y a pas forcément besoin d’un énorme moat ; le problème survient surtout quand les utilisateurs restent insatisfaits du produit ou qu’il existe un concurrent bien meilleur dont tout le monde parle
Si les fonctionnalités d’Apple n’apportent pas d’avantage significatif par rapport au simple fait d’utiliser GPT, il sera difficile d’espérer un miracle
La vraie question restante est de savoir si je continuerai à utiliser Kagi pour la recherche, ou si le nouveau Siri pourra m’emmener globalement là où j’ai besoin d’aller. Il faudrait que je prête davantage attention à la fréquence à laquelle je consulte réellement les résultats de recherche, par rapport au simple fait de lire des résumés IA
Il y a aussi des éléments que je n’ai pas vus dans la présentation d’Apple. Par exemple, pour du codage basique, ils ont mentionné le LLM de Xcode, l’app Shortcuts et les Safari Extensions, mais je viens justement de faire créer une page web pour afficher des données récupérées via Kagi, et Gemini pouvait aussi le faire
Siri pourra peut-être en faire autant, mais il faudra voir, et l’expérience compte aussi. ChatGPT gère bien mieux le processus d’écriture de code via une interface de codage avec éditeur en direct, tandis que Kagi donne davantage l’impression du ChatGPT d’il y a quelques années, en crachant un bloc de code entier puis en redonnant un nouveau dump de code à chaque modification
Passer par Xcode peut être excessif et Siri pourrait être insuffisant, donc il pourrait rester un vide dans les usages IA prosumer qu’Apple ne comblera pas
Anthropic ne semble pas se soucier énormément de l’IA grand public, et il est probable que les consommateurs soient la clientèle la moins rentable
Apple semble plutôt susceptible d’augmenter l’usage de l’IA chez le grand public, et cela ressemble à l’ajout des Stories par Instagram. Cela a freiné la croissance de Snapchat, mais j’hésiterais à affirmer que cela va aussi enlever beaucoup d’utilisateurs à OpenAI
Si vous payez déjà pour ChatGPT aujourd’hui, il est probable que vous l’utilisiez pour coder par loisir, pour des projets ou pour générer des images, et les gros dépensiers l’utilisent presque certainement pour des projets de programmation personnels
Les abonnés à plus de 100 dollars par mois ne partiront pas pour cette raison, et il me paraît très difficile de croire que même les utilisateurs à 20 dollars par mois s’en iront de manière significative
La plupart des utilisateurs dans le monde utilisent des téléphones bon marché avec des CPU faibles et peu de RAM, donc ils ne peuvent pas faire tourner localement des modèles vraiment utiles
Dans l’accord Google-Apple, on ne sait pas clairement si Google vend aussi pour ce milliard de dollars l’accès au calcul cloud, ou seulement les poids et la propriété intellectuelle
Apple a aussi parlé de limites d’usage et de mises à niveau par abonnement pour aller plus loin, ce qui ouvre un front de concurrence directe avec les laboratoires d’IA. Même avec une option par défaut, des concurrents prospères comme Safari et Chrome existent, donc cette concurrence est possible aussi
Il est aussi très probable que Google fournisse ses modèles à prix réduit par rapport à leur valeur réelle afin de supprimer l’incitation économique qui pousserait un principal concurrent disposant de beaucoup de cash à entrer dans la course aux armements de l’entraînement des modèles de base
Les utilisateurs qui veulent des fonctions sérieuses au-delà des résumés et de la retouche de style peuvent trouver de la valeur, même pour un usage occasionnel, dans un abonnement raisonnable ou un tarif financé par la publicité pour des modèles de meilleure qualité
Apple peut aussi proposer cela, mais dès qu’on commencera à comparer les fonctionnalités, Gemini, Claude et ChatGPT pourraient mieux convenir à beaucoup de gens
Et il existe aussi un risque très réel qu’Apple promette encore trop, puis sorte un modèle de qualité médiocre, ce qui pousserait davantage d’utilisateurs vers des services par abonnement
Cela inclut leur vie personnelle, leurs intérêts, leurs projets, leur activité et des informations sur leur famille ; passer à une autre application d’IA impose donc pratiquement de repartir de zéro, ce qui est assez pénible
L’un des signes qui permet de repérer un agitateur bidon, c’est ce ton outré du genre « pourquoi personne ne comprend ça ? », alors que le raisonnement ne tient pas réellement la route
Si l’argument de Zitron est aussi solide qu’il le dit, le lecteur devrait pouvoir le comprendre et voir qu’il est solide
S’il partait des statistiques sur la demande en IA pour enchaîner prudemment vers l’étape suivante, comme le chiffre d’affaires nécessaire à la rentabilité des entreprises d’IA, on pourrait suivre ; mais il saute des étapes, fait des bonds, puis revient en arrière
Si la situation était vraiment aussi évidente qu’un « pourquoi vous ne le voyez pas ? », l’explication devrait l’être aussi, or ce n’est pas le cas. Si ce n’est pas clair, c’est parce que la situation elle-même ne l’est pas autant
Son message, au fond, c’est que l’industrie technologique est profondément corrompue sur le plan moral. Il est difficile d’en parler sans s’emporter, mais cela ressemble moins à une exagération gratuite qu’à une forme d’incrédulité : « pourquoi continuez-vous à investir dans Meta et à y travailler malgré les preuves accablantes que c’est une entreprise qui fait des choses atroces aux gens ? »
Malgré tout, ce que j’ai compris de son raisonnement, c’est que les entreprises d’IA se sont engagées à acheter une quantité X de calcul, que des datacenters sont construits pour répondre à cette demande, que ces datacenters doivent encaisser Y, et que les entreprises d’IA n’ont pas assez de revenus pour payer Y
Personnellement, cela ne me surprend pas. Les usages concrets de l’IA que j’ai vus se limitent surtout à la génération de code ou aux appels automatisés de démarchage et d’arnaque, et cela ne ressemble pas à un marché assez vaste pour absorber les montants énormes qui circulent actuellement
Je me demande pourquoi on considère qu’Ed se trompe à ce point. Pour moi, une grosse correction se profile pour l’IA dans son ensemble
Ce n’est pas le genre d’information dont on peut raisonnablement attendre qu’elle soit recopiée à l’identique dans chaque billet de blog récurrent
C’est dit sur un ton sarcastique, mais si vous avez vraiment cliqué, la réponse m’intéresse sincèrement
C’est une pauvre tentative d’imiter le journalisme moderne de révélation, qui veut être spirituelle mais manque de substance
Cela a déjà été beaucoup dit, mais Ed Zitron est quelqu’un à qui il est difficile de faire confiance
À mes yeux, il s’est souvent montré partial et dans l’erreur, même sur des choses très évidentes et triviales, ce qui rend difficile de prendre telles quelles ses analyses complexes remplies de chiffres et de tendances
Je me souviens par exemple d’un tweet, il y a quelques mois, où il se moquait des gens qui parlaient d’agents et de codage agentique. C’était du genre : « Des agents ? Quels agents ? Ils savent au moins de quoi ils parlent ? », et les réponses contenaient des centaines de témoignages de personnes expliquant qu’elles utilisaient réellement des agents
Il a un public et un objectif d’engagement, et son but n’est pas d’informer mais d’obtenir des clics
Il a peut-être raison sur la direction générale. Par exemple, il a peut-être raison de dire que les revenus nécessaires pour couvrir les dépenses paraissent absurdement élevés, mais on a l’impression qu’il mélange des chiffres pour construire le pire scénario possible, sans qu’il corresponde forcément à la réalité
Si on ajoute à cela le fait qu’il ne montre aucune ouverture envers tout ce qui touche, même de loin, à l’IA, il devient difficile de le prendre au sérieux
Les publications aiment les longues diatribes catastrophistes et déprimantes, si bien qu’on a l’impression qu’il s’est construit une carrière avec des articles anti-IA hystériques. Cela ne veut pas dire qu’il ait raison
La partie la plus convaincante du texte, c’est qu’à la simple lecture des chiffres, l’ampleur des investissements nécessaires semble insoutenable en purs dollars
Même sans être d’accord avec l’auteur, on peut suivre le raisonnement. OpenAI, SpaceX et Anthropic devront entrer en bourse cette année s’ils veulent éviter de manquer d’argent, car il n’y a plus assez de capitaux privés disponibles. L’IPO est le dernier tour de financement
L’IA peut être très utile et transformatrice, et les entreprises peuvent croître rapidement, mais il se peut qu’il n’y ait pas l’argent nécessaire pour soutenir cette croissance
Le passage sur une entreprise d’IA en faillite qui a annulé son contrat avec Oracle m’a fait voir Oracle comme une sorte de Nortel : si un gros bloc de clients disparaît soudainement, il pourrait falloir passer des dépréciations de plusieurs dizaines ou centaines de milliards de dollars
Je suis profondément sceptique à l’égard des maîtres de l’IA, mais continuer à affirmer qu’il n’y a rien du tout n’est pas honnête
Pour Zitron, on en est désormais au stade où il supplie presque qu’un effondrement arrive
Il a certes eu raison de pointer un énorme risque financier via une analyse macro, mais son pessimisme incessant lui fait complètement manquer l’utilité concrète d’une énorme hausse de productivité que beaucoup de gens sur HN ressentent au quotidien
Pour l’instant, j’ai envie de croire qu’il existe une zone intermédiaire où cette amplification des capacités individuelles débouche sur de grandes découvertes
Alors où va toute cette productivité, où est la valeur, où sont les statistiques de chômage massif ou les millions de nouvelles startups qui gagnent énormément d’argent ? Je n’en sais rien
Une voix opposée a de la valeur en soi, car il faut une critique équilibrée dans un cycle de hype surchauffé, mais ses arguments ne sont pas solides, même si l’on accepte ses prémisses
Mon principal reproche à ses calculs à la louche, c’est qu’il traite les marges brutes de l’inférence comme quelque chose de nouveau qu’on ne pourrait pas comparer aux marges d’un SaaS classique
C’est partiellement vrai. L’entraînement des modèles, la construction de l’infrastructure associée et le carrousel incessant de R&D et de coûts périphériques nécessaires pour rester compétitif modifient un peu l’analyse
Mais dire que c’est structurellement différent des marges d’un SaaS classique, c’est aller trop loin. Le modèle économique ne ressemble pas à Dropbox, mais il est assez proche des débuts d’AWS, des CDN et des opérateurs télécoms
Je peux en parler, car j’ai passé plus de la moitié de ma carrière dans les télécoms comme ingénieur puis fondateur : même une activité d’infrastructure extrêmement capitalistique, dont la rentabilité dépend du taux d’utilisation, de la survente, de la planification de capacité en pointe, de la segmentation et du retour sur capex, peut fonctionner
L’apparition explicite de la segmentation des tâches pour réduire les coûts rend ses calculs encore plus douteux. Les organisations les plus en avance réalisent qu’il n’est pas nécessaire d’utiliser le meilleur et le plus cher des modèles pour chaque tâche
On peut router les tâches simples vers des modèles bon marché, utiliser du cache, traiter en batch les tâches non urgentes et ne réserver les modèles de pointe qu’à la fraction des tâches qui requièrent réellement une intelligence de pointe. Cela contredit frontalement l’argument selon lequel les fournisseurs doivent en permanence poursuivre une intelligence de pointe afin de maintenir la demande actuelle, le taux d’utilisation et la courbe des prix
On peut ressentir un gain de productivité sans qu’une vraie valeur soit effectivement créée, et c’est précisément ce que montrent, à mon avis, les données les plus solides
https://unessays.substack.com/p/talk-is-cheap
Y a-t-il une grande étude évaluée par les pairs ou une méta-étude qui confirme cette affirmation ?
Le simple fait qu’il n’ait jamais pris la peine de revenir sur les échecs manifestes de sa propre analyse dit tout ce qu’il faut savoir sur son honnêteté intellectuelle
Il y a une part de vérité dans certains de ses propos sur le risque financier, mais si l’on est incapable de reconnaître aussi le potentiel de hausse, on ne peut pas évaluer correctement le risque
C’est pour cela que j’ai du mal à le prendre au sérieux
Il y a beaucoup de commentaires expéditifs dans ce fil, mais rares sont ceux qui abordent le fond réel de l’article
La vraie question est de savoir si l’affirmation « L’IA ne peut pas se permettre de ralentir — elle a besoin de plus de 3 000 milliards de dollars de revenus d’ici fin 2030 pour simplement maintenir son existence » est vraie
Si la masse salariale totale en 2024 était de 11,7 billions de dollars [0], et si l’emploi non agricole était de 158,000 la même année [1], alors mon calcul approximatif donne qu’il faudrait que l’IA prenne ou crée au moins 1 emploi sur 20 pour atteindre le seuil de rentabilité, soit un ordre de grandeur de plus
[0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
[1] https://fred.stlouisfed.org/series/PAYEMS
Des sommes énormes ont été injectées dans l’économie en 2008 puis entre 2020 et 2023, et les riches sont devenus absurdement riches. Cette richesse est maintenant immobilisée dans la version années 2020 du rail/de la fibre optique, et on essaie en quelque sorte de réinitialiser la situation en effaçant en pratique des milliers de milliards de dollars de l’économie mondiale
Une réinitialisation est effectivement nécessaire
Avant de consacrer 20 minutes à lire cet article, il faut savoir que son auteur publie depuis plus de deux ans des opinions populaires mais constamment erronées du type : l’IA est en train d’échouer, c’est un gaspillage d’argent, c’est mauvais et ça ne marchera jamais
Il y a par exemple un article comme celui de mars 2024 : https://www.wheresyoured.at/peakai/
Pendant deux ans, il avait clairement l’air d’un fou et a raté la forte hausse du marché, mais au final il avait raison. Bien sûr, les valeurs technologiques se sont ensuite redressées lentement
Il est notoirement difficile de prévoir le timing de ce genre de choses, et s’être trompé de deux ans il y a quelque temps ne veut pas dire qu’il n’y aura pas de correction
Ed est plutôt intéressant comme indicateur, mais j’ai du mal à prendre vraiment au sérieux ce qu’il écrit
Tim Lee a aussi souligné qu’il y avait des points assez étranges dans certains détails de l’analyse d’Ed lorsqu’il les a publiés : https://x.com/binarybits/status/2034377838883700953
Dès que la fenêtre d’abonnement à la newsletter apparaît, je ferme immédiatement l’onglet
Ed est un personnage intéressant
Son analyse financière du secteur de l’IA se tient sur le plan logique, mais je n’ai pas assez de connaissances pour savoir si elle est réellement juste
Cela dit, il semble tellement en colère contre l’IA en général qu’il passe à côté de domaines évidents où les LLM font réellement bouger l’état de l’art
Le code semble être l’un des principaux usages des LLM, comme Simon Willison l’a récemment souligné, et même si c’était leur seul vrai usage, ce serait déjà extrêmement utile
L’utilité et la rentabilité sont deux choses différentes, et je pense qu’Ed met le doigt sur un point important là-dessus. Tant que l’inférence ne coûtera pas beaucoup moins cher, ces entreprises ne pourront pas être rentables, et si quelques acteurs géants paieront peut-être le prix des tokens API, la plupart ne le feront pas
Si les entreprises d’IA ont besoin de dizaines de milliards de dollars de chiffre d’affaires pour tenir, le fait que 0,5 %, 5 % ou 50 % de ce chiffre vienne d’usages qui font bouger l’état de l’art est totalement sans rapport
Ce qui compte, ce n’est pas qu’il y ait transformation ou non, mais que ces entreprises n’auront pas les revenus pour payer les factures, et si elles ne le peuvent pas, beaucoup d’autres entreprises ne le pourront pas non plus
Donc, transformation ou pas, cela reste un château de cartes en attente de l’effondrement. Pour changer cela, il ne faut pas davantage de « transformation », mais un ensemble de fonctionnalités capable soit de multiplier la base d’utilisateurs actuelle, soit de multiplier les prix
D’une certaine manière, c’est assez rafraîchissant. Beaucoup de gens critiquent tel ou tel aspect de l’IA, puis terminent par une clause de non-responsabilité du genre « mais en fait j’aime vraiment l’IA et je l’utilise tous les jours »
Il cherche sans doute à éviter la situation où des builders pragmatiques débarquent dans les commentaires pour livrer calmement de la nuance, autrement dit, dans le jargon actuel, se faire tomber dessus par des guerriers du clavier en colère avec une puce sur l’épaule, et il est épuisant de devoir se frayer un chemin à travers ce faux équilibre
C’est plus difficile de lui adresser cette critique à Zitron. Quoi qu’on dise de lui, il n’a pas peur de donner l’impression de prendre parti
Ce sont trois positions totalement distinctes. On peut penser que l’IA est très utile tout en la détestant parce qu’elle pourrait faire baisser son statut social, ou aimer la technologie tout en estimant que Sam Altman est malhonnête
Pourtant, beaucoup de polémistes anti-IA semblent curieusement sentir qu’ils doivent avancer les trois arguments à la fois
Plus drôle encore, si c’était vraiment inutile, il n’y aurait pas lieu de s’en soucier. Le marché finirait par constater l’inutilité, tout reviendrait à la normale et ceux qu’ils détestent perdraient leur argent
Bien sûr, je ne pense pas qu’ils croient réellement que c’est inutile. Je pense plutôt qu’ils s’inquiètent de l’effet que cela pourrait avoir sur leur prestige, et qu’ils espèrent ardemment qu’un jour tout le monde va « se réveiller » et partager la conviction que les LLM ne sont rien d’autre que des perroquets stochastiques sans utilité. Mais les gens les utilisent tous les jours, et voient en temps réel qu’ils s’améliorent
Son argument est que, pour que ces entreprises soient rentables, il faudrait que se produisent de très grandes choses sans précédent avant 2022. Je suis globalement d’accord, mais je pense que ces choses se produisent déjà depuis quelques années, donc elles continueront sans doute à se produire
Il n’y a absolument aucune raison de croire que l’inférence est chère, en dehors d’une ambiance générale. Les données et l’intuition indiquent que les marges sont élevées
Cette manière de penser renforce ma conviction que les gens, sans vraiment savoir, utilisent la formule « l’IA n’est pas rentable et coûte trop cher » comme une forme de catharsis face à des avancées énormes
Zitron est un acteur dont l’activité n’est pas d’avoir raison dans ses prédictions, mais de produire du contenu
Peu importe combien de fois lui et d’autres du même genre annoncent que la fin est proche : il leur suffit d’avoir raison une seule fois
Cela dit, à l’heure actuelle, il a clairement raison sur certains points concernant l’économie. On ne voit toujours pas comment récupérer cet investissement gigantesque
À mes yeux, l’IA va transformer le monde de manière radicale
Cela peut empirer les choses, les améliorer, ou faire un mélange des deux, mais je n’en doute pas une seconde
Le bond des LLM n’a commencé qu’il y a 5 ou 6 ans à peine. À titre de comparaison, les ondes radio ont été découvertes en 1886, Marconi les a utilisées pour communiquer en 1895, le téléphone et la radio ont coexisté pendant des décennies, mais la téléphonie mobile et les technologies sans fil n’ont vraiment décollé qu’en 1995
Si cela a pris si longtemps, ce n’est pas parce qu’il fallait attendre que la physique des ondes radio mûrisse, mais parce que tout le reste nécessaire pour en tirer profit a eu besoin de temps
Pour moi, les LLM se rapprochent moins de l’IA que de briques de base. Ils pourraient être l’équivalent des ondes radio ou du transistor
On voit déjà qu’il est possible de relier des LLM pour en faire des agents. Pour l’instant, le prix est la contrainte majeure, aussi bien pour le code que pour les agents
Si vous ne voulez que Claude Code ou Codex, ça reste à peu près raisonnable, mais il existe beaucoup de combinaisons de LLM que la plupart des gens n’osent même pas expérimenter. Par exemple, faire tourner les dialogues de PNJ et les mécaniques d’un monde de jeu sur des LLM n’est pas encore viable à cause du coût
Si le prix du matériel d’inférence baisse et que les algorithmes d’inférence continuent de s’améliorer, je suis convaincu — et cela m’effraie aussi — que nous verrons des choses difficiles à imaginer aujourd’hui
Le coût n’est pas le vrai problème. Les réponses et scénarios cohérents dans leur contexte sont en nombre limité, donc un LLM n’a pas besoin de générer du texte en temps réel dans le jeu
À la place, on peut utiliser un LLM pour produire un énorme corpus d’« atomes » comme des messages de dialogue, des fragments, des indices, puis les assembler de façon déterministe selon les entrées du joueur. On peut aussi faire une revue préalable et divers tests avant l’implémentation
Pour un joueur qui interagit dans un jeu, un tel système serait, dans le cadre des interactions prévues, difficile à distinguer fonctionnellement d’un texte généré
Les avantages sont aussi considérables. Si le joueur sort de son rôle et cherche délibérément les coutures, elles peuvent apparaître, mais le système n’est pas exploitable de la même manière qu’un LLM
Quel éclair de génie que de soupçonner qu’une chose pourrait rendre le monde meilleur, pire, ou les deux à la fois
Dire aussi que « nous sommes encore trop tôt » est étrange. On a déjà eu plusieurs publicités au Super Bowl, des entreprises qui monopolisent pratiquement l’actualité tech en faisant répéter mot pour mot par des journalistes les absurdités de leurs CEO, et quand elles affirment valoir plus de 1 000 milliards de dollars, les seules personnes ayant autorité pour contester leurs finances semblent simplement acquiescer
On a construit des data centers de plusieurs centaines d’acres, signé des contrats de data centers qui ne se concrétiseront pas, et réclamé des dizaines de milliards de dollars par mois
Cela a avalé tout le silicium, au point que les gens voient de leurs propres yeux le prix du matériel doubler, tripler, voire plus
Des entreprises ont imposé l’usage de l’IA à leurs employés, puis ont fait machine arrière quand les subventions ont disparu et que les coûts réels sont apparus
Et malgré cela, on nous dit qu’il faudrait encore plus de temps, encore plus d’attention, encore plus de gens qui regardent. Je ne vois pas à quel moment, dans l’histoire des ondes radio, quelque chose de comparable s’est produit
La simulation est ennuyeuse
Ed voit dans le fait que « l’IA ralentit » un signe lié aux plafonds de dépenses des entreprises, en particulier la limite mensuelle de 1 500 dollars par outil et par ingénieur chez Uber
J’interprète exactement la même preuve à l’inverse. Il y a un an encore, l’idée qu’une entreprise dépense 1 500 dollars par mois et par employé pour des outils d’IA paraissait absurde, et on se demandait bien ce qu’on pouvait faire avec de l’IA pour arriver à ce montant
Mais avec l’arrivée des agents de code et des agents de plus en plus généralistes, la demande des employés est devenue si forte que les entreprises ont dû imposer des limites
Le marché total adressable de ces entreprises d’IA a bondi à 1 500 dollars par mois et par travailleur du savoir, et je ne vois pas en quoi cela ressemble à un ralentissement
Mais pour obtenir le retour sur investissement attendu, il faudrait dépenser cette somme — ou plus — à l’échelle mondiale, et aucun budget de ce niveau ne passera sur le long terme
Les entreprises aiment réduire les coûts, et dès qu’elles jugeront qu’il existe une autre façon d’obtenir la même valeur, voire une meilleure, comme lorsqu’elles réduisent leurs effectifs à leur guise, ces budgets disparaîtront vite
Ou bien ils disparaîtront simplement sous la pression des actionnaires, focalisés sur la valeur à court terme
Autrement dit, rien qu’avec Claude Code et Cursor, on arrive facilement à 3 000 dollars par mois, et si Codex s’ajoute comme option, on peut monter à 4 500 dollars
Et comme vous l’avez écrit sur votre blog, c’est un plafond souple qu’on peut dépasser si on sait le justifier