6 points par GN⁺ 4 시간 전 | 2 commentaires | Partager sur WhatsApp
Publicité
  • Pour justifier les investissements dans les data centers et les engagements en capacité de calcul, l’infrastructure d’IA générative doit générer plus de 2 000 milliards de dollars de revenus annuels liés au calcul IA d’ici 2030
  • Les 190 GW de data centers prévus représentent 9 500 à 15 000 milliards de dollars en appliquant un coût de 80 à 100 milliards de dollars par GW, et leur concrétisation nécessiterait l’émission annuelle de 500 à 1 000 milliards de dollars de dette de data center
  • OpenAI devrait avoir brûlé au moins 852 milliards de dollars d’ici fin 2030, tandis qu’Anthropic devra atteindre un objectif de 174 milliards de dollars de chiffre d’affaires annuel en 2029 pour assumer ses engagements de calcul
  • Depuis le passage à une facturation basée sur les tokens, les entreprises peinent à avoir de la visibilité sur leurs dépenses IA et à mesurer le ROI, et Uber, T-Mobile et Brex ont fixé des plafonds de dépenses en tokens par employé
  • Actuellement, 89 % des revenus des startups IA sont concentrés chez OpenAI et Anthropic, si bien qu’il faudra au minimum 250 milliards de dollars supplémentaires de demande annuelle en calcul IA pour justifier l’ampleur des capacités en cours de construction

L’IA ne peut pas se permettre de ralentir — plus de 3 000 milliards de dollars de revenus nécessaires d’ici fin 2030

  • En appliquant directement les données de Sightline Climate, la capacité planifiée des data centers atteint 190 GW et, en reprenant la déclaration de Jensen Huang sur un coût de 80 à 100 milliards de dollars par GW, le coût total est estimé entre 9 500 et 15 000 milliards de dollars
  • L’affirmation de Bloomberg sur une construction de data centers à hauteur de 3 000 milliards de dollars ne correspond pas à ce calcul, et les fonds nécessaires devront être levés quelque part
  • Un article du Financial Times estimait que les banques pourraient ne pas être en mesure d’absorber la dette liée aux data centers, et que les émissions annuelles, actuellement autour de 250 milliards de dollars, devraient grimper à 500 milliards voire 1 000 milliards de dollars pour permettre la construction réelle
  • NVIDIA prévoit 1 000 milliards de dollars de revenus d’ici fin 2027 et, 54 % de ses revenus provenant de trois clients, ses revenus futurs dépendront d’un petit nombre de clients et de la capacité de leurs contreparties à lever de la dette
  • La cession de 85 milliards de dollars d’actions par Google et le projet de Meta de vendre pour des dizaines de milliards de dollars d’actions sont liés à un contexte où le financement par la dette devient plus difficile pour les hyperscalers

Les engagements de calcul d’OpenAI et d’Anthropic

  • Les engagements d’Anthropic en calcul et en puces atteignent 330 milliards de dollars auprès de Google, Amazon et Microsoft, 30 milliards auprès de CoreWeave et 15 milliards auprès de SpaceX
  • Pour couvrir ce coût de calcul, Anthropic devra atteindre son objectif de 174 milliards de dollars de chiffre d’affaires annuel en 2029
  • Anthropic a levé 95 milliards de dollars lors des tours de février, avril et mai, mais ces fonds et les flux de trésorerie ne suffiront pas à couvrir les coûts, ce qui imposera de lever au moins 200 milliards de dollars supplémentaires l’année suivante
  • OpenAI devrait brûler au moins 852 milliards de dollars d’ici fin 2030 et a contracté plus de 770 milliards de dollars d’engagements de calcul auprès de Microsoft, Amazon, CoreWeave, Cerebras et Oracle
  • La levée de 122 milliards de dollars d’OpenAI en mars ne suffit pas à couvrir les coûts, et au moins 250 milliards de dollars de financements supplémentaires seront nécessaires d’ici la fin de l’année

Calcul des revenus des data centers et risque pour Oracle

  • L’IA générative et le calcul IA doivent générer plus de 2 000 milliards de dollars de revenus annuels d’ici 2030, faute de quoi les dépenses d’investissement des data centers et le paiement des engagements d’Anthropic et d’OpenAI ne tiendront pas
  • En appliquant un PUE de 1,35 à 190 GW de data centers, la charge IT utile tombe à environ 140 GW, ce qui exige 1 750 milliards de dollars de revenus annuels sur la base d’une facturation de 12,5 millions de dollars par MW
  • Même si seulement la moitié de la capacité prévue est construite, il faudrait encore 875 milliards de dollars de revenus annuels pour éviter que les data centers ne se retrouvent à court d’argent
  • OpenAI et Anthropic prévoient respectivement 184 et 174 milliards de dollars de revenus en 2029, soit seulement 358 milliards de dollars au total
  • Si OpenAI ne peut pas ou ne veut pas assumer le calcul fourni par Oracle, Oracle pourrait se retrouver à court de liquidités, alors que l’entreprise dépense 340 à 700 milliards de dollars pour des data centers totalisant 7,1 GW dédiés à OpenAI
Publicité

Les dépenses actuelles en IA sont insuffisantes

  • Le projet de Salesforce de dépenser 300 millions de dollars chez Anthropic en 2026 est très loin de l’échelle requise
  • La somme de la demande actuelle en calcul de toutes les entreprises IA dans le monde n’atteint pas 100 milliards de dollars, alors qu’il en faudra 10 fois plus en 2030
  • Selon The Information, la concentration des revenus des startups IA chez OpenAI et Anthropic atteint 89 %, comme indiqué par {p:89}
  • Le rythme annualisé de 37 milliards de dollars de Microsoft en IA repose principalement sur le calcul OpenAI, et le CEO de Microsoft AI, Mustafa Suleyman, estime que les modèles d’Anthropic sont trop chers et cherche à ramener leur usage à zéro chez Microsoft
  • Même si Anthropic et OpenAI consommaient 500 milliards de dollars de calcul par an, il faudrait encore plus de 250 milliards de dollars de revenus annuels supplémentaires en calcul pour justifier la construction des data centers

Facturation au token et incertitude sur le ROI

  • Le coût et le retour sur investissement de tâches IA spécifiques ne sont pas mesurables, et les entreprises ont étendu leur adoption de l’IA sans mesurer réellement les résultats produits
  • Anthropic et OpenAI ont basculé leurs clients vers une facturation basée sur les tokens au premier trimestre 2026, et en l’espace de deux à trois mois l’incertitude sur les coûts IA et le ROI est devenue un thème récurrent dans les grands médias économiques
  • Dans une enquête KPMG citée par le Wall Street Journal, la visibilité sur les coûts IA se répartit entre 26 % de vision globale, 50 % de vision partielle et 22 % d’absence de visibilité ou de connaissance seulement après facturation, comme dans {b:26,50,22}
  • Une entreprise, faute de contrôle des dépenses, a dépensé 500 millions de dollars en un mois sur les modèles d’Anthropic, et Uber a épuisé en un seul trimestre son budget annuel de tokens
  • Uber limite les dépenses IA à 1 500 dollars par utilisateur et par mois, T-Mobile provisoirement à 2 000 dollars par utilisateur et par mois, et Brex à 500 dollars par semaine pour les ingénieurs et 5 dollars par semaine pour les non-ingénieurs

Agents de code, boucles et problème des résultats produits

  • Boris Cherny, responsable de Claude Code, et Peter Steinberger, évangéliste d’OpenClaw détenu par OpenAI, demandent aux utilisateurs de concevoir des boucles pour les agents
  • Les boucles consistent à permettre à un LLM de continuer à agir pendant la durée souhaitée sans que l’utilisateur n’ait à ajouter de prompt supplémentaire
  • Avec les abonnements grand public, le coût des erreurs du modèle est masqué derrière 20, 100 ou 200 dollars par mois, mais quand l’utilisateur paie le coût réel, celui de l’échec apparaît tel quel
  • Cela rejoint les recherches selon lesquelles plus un LLM raisonne, plus les hallucinations augmentent, tandis que l’approche par agents laisse le LLM élaborer lui-même son plan
  • Notion a bloqué l’accès à Anthropic pendant plusieurs heures après une interruption de service d’Anthropic, et nombre d’applications produites par les outils de codage IA ne sont au final que du slopware inutile et peu sûr

La métaphore de l’araignée géante en métal

  • L’araignée géante en métal est un appareil à 1 million de dollars, qui coûte 40 000 dollars de carburant à chaque utilisation, mais peut saisir des objets ou préparer le dîner
  • Le même appareil peut aussi bien sortir précisément un Diet Coke du réfrigérateur que percer un trou dans ce même réfrigérateur, et l’utilisateur doit payer 40 000 dollars quel que soit le résultat
  • Grâce aux subventions, le grand public ne subit que ponctuellement les comportements destructeurs, mais les entreprises supportent le coût réel et le fabricant perd des milliards chaque année en entraînement et en maintenance
  • Les nouvelles fonctionnalités élargissent la liste de ce que l’appareil est censé pouvoir faire, mais chaque ajout de fonction coûte des centaines de millions de dollars, sans qu’il soit toujours clair qu’il ait réellement appris quelque chose de nouveau
  • Même s’il existe une étude montrant une hausse de la capacité à accomplir à 50 % des tâches d’une certaine longueur, l’araignée de la métaphore peut encore se tromper à tout moment et agir sans que l’utilisateur le lui ait demandé

L’économie circulaire de l’IA et la demande réelle pour les produits

  • L’IA générative a un coût d’exécution élevé, les principaux laboratoires d’IA n’ont pas de trajectoire vers la rentabilité, et le coût comme le ROI des tâches fondées sur des LLM restent impossibles à mesurer
  • Les projets IA peuvent accroître les coûts d’exploitation de 10 % à 100 %, et contrairement à la promesse d’une baisse des coûts pour les opérateurs de services IA comme pour leurs clients, les dépenses ont augmenté
  • Ces coûts élevés entretiennent une structure où les laboratoires d’IA envoient de l’argent à leurs partenaires hyperscalers de calcul, argent qui recircule ensuite vers les laboratoires et la demande en GPU NVIDIA
  • Si OpenAI ou Anthropic cherchent la rentabilité ou la soutenabilité, la demande en calcul IA diminuera, tout comme la demande pour Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure et les GPU NVIDIA
  • Pour être à la hauteur des engagements et des perspectives actuels, l’ensemble de la stack IA doit être multiplié par 10, avec 250 milliards de dollars supplémentaires de demande annuelle en calcul IA et au moins deux entreprises supplémentaires de la taille d’OpenAI ou d’Anthropic
Publicité

2 commentaires

 
mammal 1 시간 전

L’API n’a jamais cessé d’être facturée au token...

 
GN⁺ 4 시간 전
Commentaires Hacker News
  • Aujourd’hui, Apple a dévoilé ses fonctionnalités IA remaniées et, si l’on en croit plusieurs articles, Apple ne paierait à Google qu’environ 1 milliard de dollars par an pour les faire tourner
    Cela revient en pratique à une simple licence de propriété intellectuelle, et Google semble considérer comme acceptable de céder pour ce montant le droit d’exploiter et de distiller son propre modèle
    Même si les revenus grand public ne représentent qu’une partie du puzzle, on peut se demander pourquoi les utilisateurs de Mac ou d’iPhone auraient besoin de payer pour ChatGPT si la nouvelle IA d’Apple répond déjà à leurs besoins
    Google va lui aussi intégrer des outils comparables dans les téléphones et continuer à proposer des fonctions IA dans la recherche, donc je ne vois pas où est la preuve qu’après l’arrivée de la technologie d’Apple, l’IA grand public vaut pour Anthropic ou OpenAI bien plus de 1 milliard de dollars par an
    Même si OpenAI signait un accord pour être intégré aux téléphones Samsung et que Samsung était 10 fois plus désespéré qu’Apple, cela ferait environ 10 milliards de dollars par an ; or si les prévisions de revenus grand public d’OpenAI pour 2026 sont de 14 à 15 milliards de dollars, alors même en les atteignant, cela semble difficile à maintenir une fois que des fonctions intégrées utiles existeront pour les utilisateurs d’iPhone
    Ed Zitron ressemble davantage à un agitateur bruyant à l’anglaise, mais il semble globalement dire des choses justes

    • Ce serait pour une raison similaire à celle pour laquelle l’application Gemini, bien qu’elle soit préinstallée par défaut sur les téléphones Android dans le monde entier, reste très loin derrière ChatGPT en usage et en adoption côté grand public
      Même avec un bouton Copilot sur Windows, les gens utilisent GPT ; Microsoft Edge n’est pas le navigateur le plus populaire sur Windows ; et Instagram Threads n’a pas vraiment porté un grand coup à TikTok
      La question est posée à l’envers. Les gens ont une forte préférence pour ce qu’ils aiment déjà utiliser et veulent continuer à l’utiliser
      Il n’y a pas forcément besoin d’un énorme moat ; le problème survient surtout quand les utilisateurs restent insatisfaits du produit ou qu’il existe un concurrent bien meilleur dont tout le monde parle
      Si les fonctionnalités d’Apple n’apportent pas d’avantage significatif par rapport au simple fait d’utiliser GPT, il sera difficile d’espérer un miracle
    • J’utilise Kagi Assistant pour l’IA, mais à l’automne Siri pourrait peut-être le remplacer
      La vraie question restante est de savoir si je continuerai à utiliser Kagi pour la recherche, ou si le nouveau Siri pourra m’emmener globalement là où j’ai besoin d’aller. Il faudrait que je prête davantage attention à la fréquence à laquelle je consulte réellement les résultats de recherche, par rapport au simple fait de lire des résumés IA
      Il y a aussi des éléments que je n’ai pas vus dans la présentation d’Apple. Par exemple, pour du codage basique, ils ont mentionné le LLM de Xcode, l’app Shortcuts et les Safari Extensions, mais je viens justement de faire créer une page web pour afficher des données récupérées via Kagi, et Gemini pouvait aussi le faire
      Siri pourra peut-être en faire autant, mais il faudra voir, et l’expérience compte aussi. ChatGPT gère bien mieux le processus d’écriture de code via une interface de codage avec éditeur en direct, tandis que Kagi donne davantage l’impression du ChatGPT d’il y a quelques années, en crachant un bloc de code entier puis en redonnant un nouveau dump de code à chaque modification
      Passer par Xcode peut être excessif et Siri pourrait être insuffisant, donc il pourrait rester un vide dans les usages IA prosumer qu’Apple ne comblera pas
    • Même si OpenAI atteint 14 à 15 milliards de dollars de revenus grand public en 2026, j’accepterais volontiers de parier le même montant du côté opposé à l’idée que ce sera sa dernière année
      Anthropic ne semble pas se soucier énormément de l’IA grand public, et il est probable que les consommateurs soient la clientèle la moins rentable
      Apple semble plutôt susceptible d’augmenter l’usage de l’IA chez le grand public, et cela ressemble à l’ajout des Stories par Instagram. Cela a freiné la croissance de Snapchat, mais j’hésiterais à affirmer que cela va aussi enlever beaucoup d’utilisateurs à OpenAI
      Si vous payez déjà pour ChatGPT aujourd’hui, il est probable que vous l’utilisiez pour coder par loisir, pour des projets ou pour générer des images, et les gros dépensiers l’utilisent presque certainement pour des projets de programmation personnels
      Les abonnés à plus de 100 dollars par mois ne partiront pas pour cette raison, et il me paraît très difficile de croire que même les utilisateurs à 20 dollars par mois s’en iront de manière significative
    • La voie évidente par laquelle les laboratoires d’IA gagnent des clients, ce sont les GPU cloud
      La plupart des utilisateurs dans le monde utilisent des téléphones bon marché avec des CPU faibles et peu de RAM, donc ils ne peuvent pas faire tourner localement des modèles vraiment utiles
      Dans l’accord Google-Apple, on ne sait pas clairement si Google vend aussi pour ce milliard de dollars l’accès au calcul cloud, ou seulement les poids et la propriété intellectuelle
      Apple a aussi parlé de limites d’usage et de mises à niveau par abonnement pour aller plus loin, ce qui ouvre un front de concurrence directe avec les laboratoires d’IA. Même avec une option par défaut, des concurrents prospères comme Safari et Chrome existent, donc cette concurrence est possible aussi
      Il est aussi très probable que Google fournisse ses modèles à prix réduit par rapport à leur valeur réelle afin de supprimer l’incitation économique qui pousserait un principal concurrent disposant de beaucoup de cash à entrer dans la course aux armements de l’entraînement des modèles de base
      Les utilisateurs qui veulent des fonctions sérieuses au-delà des résumés et de la retouche de style peuvent trouver de la valeur, même pour un usage occasionnel, dans un abonnement raisonnable ou un tarif financé par la publicité pour des modèles de meilleure qualité
      Apple peut aussi proposer cela, mais dès qu’on commencera à comparer les fonctionnalités, Gemini, Claude et ChatGPT pourraient mieux convenir à beaucoup de gens
      Et il existe aussi un risque très réel qu’Apple promette encore trop, puis sorte un modèle de qualité médiocre, ce qui pousserait davantage d’utilisateurs vers des services par abonnement
    • Les utilisateurs de ChatGPT y ont déjà versé énormément de données sur leur vie et leurs centres d’intérêt
      Cela inclut leur vie personnelle, leurs intérêts, leurs projets, leur activité et des informations sur leur famille ; passer à une autre application d’IA impose donc pratiquement de repartir de zéro, ce qui est assez pénible
  • L’un des signes qui permet de repérer un agitateur bidon, c’est ce ton outré du genre « pourquoi personne ne comprend ça ? », alors que le raisonnement ne tient pas réellement la route
    Si l’argument de Zitron est aussi solide qu’il le dit, le lecteur devrait pouvoir le comprendre et voir qu’il est solide
    S’il partait des statistiques sur la demande en IA pour enchaîner prudemment vers l’étape suivante, comme le chiffre d’affaires nécessaire à la rentabilité des entreprises d’IA, on pourrait suivre ; mais il saute des étapes, fait des bonds, puis revient en arrière
    Si la situation était vraiment aussi évidente qu’un « pourquoi vous ne le voyez pas ? », l’explication devrait l’être aussi, or ce n’est pas le cas. Si ce n’est pas clair, c’est parce que la situation elle-même ne l’est pas autant

    • J’ai toujours trouvé un peu étrange que les gens se focalisent autant sur le style d’Ed plutôt que sur son message
      Son message, au fond, c’est que l’industrie technologique est profondément corrompue sur le plan moral. Il est difficile d’en parler sans s’emporter, mais cela ressemble moins à une exagération gratuite qu’à une forme d’incrédulité : « pourquoi continuez-vous à investir dans Meta et à y travailler malgré les preuves accablantes que c’est une entreprise qui fait des choses atroces aux gens ? »
    • Quand on dit qu’il devrait partir des statistiques puis poursuivre le calcul jusqu’au chiffre d’affaires nécessaire, n’est-ce pas exactement ce que fait la première section avec son propre titre ?
    • Je ne lis Ed Zitron que lorsqu’il apparaît sur Hacker News, et je peux admettre que son ton est excessif
      Malgré tout, ce que j’ai compris de son raisonnement, c’est que les entreprises d’IA se sont engagées à acheter une quantité X de calcul, que des datacenters sont construits pour répondre à cette demande, que ces datacenters doivent encaisser Y, et que les entreprises d’IA n’ont pas assez de revenus pour payer Y
      Personnellement, cela ne me surprend pas. Les usages concrets de l’IA que j’ai vus se limitent surtout à la génération de code ou aux appels automatisés de démarchage et d’arnaque, et cela ne ressemble pas à un marché assez vaste pour absorber les montants énormes qui circulent actuellement
      Je me demande pourquoi on considère qu’Ed se trompe à ce point. Pour moi, une grosse correction se profile pour l’IA dans son ensemble
    • Je serais curieux de savoir lequel des hyperliens fournis au départ semblait correspondre à ce que vous cherchiez, et en quoi le clic vous a ensuite déçu
      Ce n’est pas le genre d’information dont on peut raisonnablement attendre qu’elle soit recopiée à l’identique dans chaque billet de blog récurrent
      C’est dit sur un ton sarcastique, mais si vous avez vraiment cliqué, la réponse m’intéresse sincèrement
    • Des formulations comme « les journalistes sont actuellement obsédés par OpenAI et Anthropic » provoquent clairement un rejet
      C’est une pauvre tentative d’imiter le journalisme moderne de révélation, qui veut être spirituelle mais manque de substance
  • Cela a déjà été beaucoup dit, mais Ed Zitron est quelqu’un à qui il est difficile de faire confiance
    À mes yeux, il s’est souvent montré partial et dans l’erreur, même sur des choses très évidentes et triviales, ce qui rend difficile de prendre telles quelles ses analyses complexes remplies de chiffres et de tendances
    Je me souviens par exemple d’un tweet, il y a quelques mois, où il se moquait des gens qui parlaient d’agents et de codage agentique. C’était du genre : « Des agents ? Quels agents ? Ils savent au moins de quoi ils parlent ? », et les réponses contenaient des centaines de témoignages de personnes expliquant qu’elles utilisaient réellement des agents
    Il a un public et un objectif d’engagement, et son but n’est pas d’informer mais d’obtenir des clics

    • Il est intéressant de voir que ses chiffres reposent sur des sources dont il dit lui-même qu’il ne leur fait pas confiance
      Il a peut-être raison sur la direction générale. Par exemple, il a peut-être raison de dire que les revenus nécessaires pour couvrir les dépenses paraissent absurdement élevés, mais on a l’impression qu’il mélange des chiffres pour construire le pire scénario possible, sans qu’il corresponde forcément à la réalité
      Si on ajoute à cela le fait qu’il ne montre aucune ouverture envers tout ce qui touche, même de loin, à l’IA, il devient difficile de le prendre au sérieux
      Les publications aiment les longues diatribes catastrophistes et déprimantes, si bien qu’on a l’impression qu’il s’est construit une carrière avec des articles anti-IA hystériques. Cela ne veut pas dire qu’il ait raison
    • Cet article contient beaucoup d’analyse quantitative, donc donner un ou deux exemples montrant pourquoi ces chiffres sont faux renforcerait sans doute l’argument
      La partie la plus convaincante du texte, c’est qu’à la simple lecture des chiffres, l’ampleur des investissements nécessaires semble insoutenable en purs dollars
      Même sans être d’accord avec l’auteur, on peut suivre le raisonnement. OpenAI, SpaceX et Anthropic devront entrer en bourse cette année s’ils veulent éviter de manquer d’argent, car il n’y a plus assez de capitaux privés disponibles. L’IPO est le dernier tour de financement
      L’IA peut être très utile et transformatrice, et les entreprises peuvent croître rapidement, mais il se peut qu’il n’y ait pas l’argent nécessaire pour soutenir cette croissance
      Le passage sur une entreprise d’IA en faillite qui a annulé son contrat avec Oracle m’a fait voir Oracle comme une sorte de Nortel : si un gros bloc de clients disparaît soudainement, il pourrait falloir passer des dépréciations de plusieurs dizaines ou centaines de milliards de dollars
    • Il traite tout le monde d’escroc, mais lui aussi en donne l’impression
      Je suis profondément sceptique à l’égard des maîtres de l’IA, mais continuer à affirmer qu’il n’y a rien du tout n’est pas honnête
  • Pour Zitron, on en est désormais au stade où il supplie presque qu’un effondrement arrive
    Il a certes eu raison de pointer un énorme risque financier via une analyse macro, mais son pessimisme incessant lui fait complètement manquer l’utilité concrète d’une énorme hausse de productivité que beaucoup de gens sur HN ressentent au quotidien
    Pour l’instant, j’ai envie de croire qu’il existe une zone intermédiaire où cette amplification des capacités individuelles débouche sur de grandes découvertes

    • Si on retire les actions liées à l’IA de n’importe quel indice boursier, que voit-on ? Rien
      Alors où va toute cette productivité, où est la valeur, où sont les statistiques de chômage massif ou les millions de nouvelles startups qui gagnent énormément d’argent ? Je n’en sais rien
    • En tout cas pour moi, il a montré de façon répétée qu’il ne comprend pas bien comment l’inférence fonctionne techniquement, ce qui affaiblit sa thèse centrale selon laquelle un effondrement doit forcément se produire
      Une voix opposée a de la valeur en soi, car il faut une critique équilibrée dans un cycle de hype surchauffé, mais ses arguments ne sont pas solides, même si l’on accepte ses prémisses
      Mon principal reproche à ses calculs à la louche, c’est qu’il traite les marges brutes de l’inférence comme quelque chose de nouveau qu’on ne pourrait pas comparer aux marges d’un SaaS classique
      C’est partiellement vrai. L’entraînement des modèles, la construction de l’infrastructure associée et le carrousel incessant de R&D et de coûts périphériques nécessaires pour rester compétitif modifient un peu l’analyse
      Mais dire que c’est structurellement différent des marges d’un SaaS classique, c’est aller trop loin. Le modèle économique ne ressemble pas à Dropbox, mais il est assez proche des débuts d’AWS, des CDN et des opérateurs télécoms
      Je peux en parler, car j’ai passé plus de la moitié de ma carrière dans les télécoms comme ingénieur puis fondateur : même une activité d’infrastructure extrêmement capitalistique, dont la rentabilité dépend du taux d’utilisation, de la survente, de la planification de capacité en pointe, de la segmentation et du retour sur capex, peut fonctionner
      L’apparition explicite de la segmentation des tâches pour réduire les coûts rend ses calculs encore plus douteux. Les organisations les plus en avance réalisent qu’il n’est pas nécessaire d’utiliser le meilleur et le plus cher des modèles pour chaque tâche
      On peut router les tâches simples vers des modèles bon marché, utiliser du cache, traiter en batch les tâches non urgentes et ne réserver les modèles de pointe qu’à la fraction des tâches qui requièrent réellement une intelligence de pointe. Cela contredit frontalement l’argument selon lequel les fournisseurs doivent en permanence poursuivre une intelligence de pointe afin de maintenir la demande actuelle, le taux d’utilisation et la courbe des prix
    • La productivité n’est pas la valeur
      On peut ressentir un gain de productivité sans qu’une vraie valeur soit effectivement créée, et c’est précisément ce que montrent, à mon avis, les données les plus solides
      https://unessays.substack.com/p/talk-is-cheap
    • Si c’est à ce point indéniable, je me demande pourquoi il n’existe absolument aucune preuve scientifique
      Y a-t-il une grande étude évaluée par les pairs ou une méta-étude qui confirme cette affirmation ?
    • Depuis 2024, il prédit en continu qu’un effondrement est imminent, que les progrès ralentissent et qu’il n’existe pas de marché de l’inférence
      Le simple fait qu’il n’ait jamais pris la peine de revenir sur les échecs manifestes de sa propre analyse dit tout ce qu’il faut savoir sur son honnêteté intellectuelle
      Il y a une part de vérité dans certains de ses propos sur le risque financier, mais si l’on est incapable de reconnaître aussi le potentiel de hausse, on ne peut pas évaluer correctement le risque
      C’est pour cela que j’ai du mal à le prendre au sérieux
  • Il y a beaucoup de commentaires expéditifs dans ce fil, mais rares sont ceux qui abordent le fond réel de l’article
    La vraie question est de savoir si l’affirmation « L’IA ne peut pas se permettre de ralentir — elle a besoin de plus de 3 000 milliards de dollars de revenus d’ici fin 2030 pour simplement maintenir son existence » est vraie
    Si la masse salariale totale en 2024 était de 11,7 billions de dollars [0], et si l’emploi non agricole était de 158,000 la même année [1], alors mon calcul approximatif donne qu’il faudrait que l’IA prenne ou crée au moins 1 emploi sur 20 pour atteindre le seuil de rentabilité, soit un ordre de grandeur de plus
    [0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
    [1] https://fred.stlouisfed.org/series/PAYEMS

    • Si l’on pense qu’il existe un petit groupe secret qui dirige réellement l’économie mondiale, on est presque dans la fiction
      Des sommes énormes ont été injectées dans l’économie en 2008 puis entre 2020 et 2023, et les riches sont devenus absurdement riches. Cette richesse est maintenant immobilisée dans la version années 2020 du rail/de la fibre optique, et on essaie en quelque sorte de réinitialiser la situation en effaçant en pratique des milliers de milliards de dollars de l’économie mondiale
      Une réinitialisation est effectivement nécessaire
  • Avant de consacrer 20 minutes à lire cet article, il faut savoir que son auteur publie depuis plus de deux ans des opinions populaires mais constamment erronées du type : l’IA est en train d’échouer, c’est un gaspillage d’argent, c’est mauvais et ça ne marchera jamais
    Il y a par exemple un article comme celui de mars 2024 : https://www.wheresyoured.at/peakai/

    • Je ne sais plus où j’ai entendu ça, mais ça me rappelle l’histoire de quelqu’un qui avait prédit trop tôt l’éclatement de la bulle internet vers 1998
      Pendant deux ans, il avait clairement l’air d’un fou et a raté la forte hausse du marché, mais au final il avait raison. Bien sûr, les valeurs technologiques se sont ensuite redressées lentement
      Il est notoirement difficile de prévoir le timing de ce genre de choses, et s’être trompé de deux ans il y a quelque temps ne veut pas dire qu’il n’y aura pas de correction
    • Peux-tu pointer les passages précis de cet article qu’on pourrait qualifier de constamment erronés ? Je ne dis pas que je ne suis pas d’accord, mais en le parcourant vite, rien ne m’a sauté aux yeux
    • La qualité du pessimisme sur l’IA vaut celle de l’optimisme sur l’IA
      Ed est plutôt intéressant comme indicateur, mais j’ai du mal à prendre vraiment au sérieux ce qu’il écrit
    • Je recommande vivement de lire le portrait de Wired : https://www.wired.com/story/ai-pr-ed-zitron-profile/
      Tim Lee a aussi souligné qu’il y avait des points assez étranges dans certains détails de l’analyse d’Ed lorsqu’il les a publiés : https://x.com/binarybits/status/2034377838883700953
    • En ce moment, le contenu anti-IA paraît un peu réconfortant, donc on a envie de cliquer, mais il continue à se tromper et pousse généralement dans la direction du « ces entreprises ne sont même pas rentables »
      Dès que la fenêtre d’abonnement à la newsletter apparaît, je ferme immédiatement l’onglet
  • Ed est un personnage intéressant
    Son analyse financière du secteur de l’IA se tient sur le plan logique, mais je n’ai pas assez de connaissances pour savoir si elle est réellement juste
    Cela dit, il semble tellement en colère contre l’IA en général qu’il passe à côté de domaines évidents où les LLM font réellement bouger l’état de l’art
    Le code semble être l’un des principaux usages des LLM, comme Simon Willison l’a récemment souligné, et même si c’était leur seul vrai usage, ce serait déjà extrêmement utile
    L’utilité et la rentabilité sont deux choses différentes, et je pense qu’Ed met le doigt sur un point important là-dessus. Tant que l’inférence ne coûtera pas beaucoup moins cher, ces entreprises ne pourront pas être rentables, et si quelques acteurs géants paieront peut-être le prix des tokens API, la plupart ne le feront pas

    • À mon avis, la question de savoir si les LLM font réellement bouger l’état de l’art n’a rien à voir avec ce qu’il a écrit
      Si les entreprises d’IA ont besoin de dizaines de milliards de dollars de chiffre d’affaires pour tenir, le fait que 0,5 %, 5 % ou 50 % de ce chiffre vienne d’usages qui font bouger l’état de l’art est totalement sans rapport
      Ce qui compte, ce n’est pas qu’il y ait transformation ou non, mais que ces entreprises n’auront pas les revenus pour payer les factures, et si elles ne le peuvent pas, beaucoup d’autres entreprises ne le pourront pas non plus
      Donc, transformation ou pas, cela reste un château de cartes en attente de l’effondrement. Pour changer cela, il ne faut pas davantage de « transformation », mais un ensemble de fonctionnalités capable soit de multiplier la base d’utilisateurs actuelle, soit de multiplier les prix
    • Il a des abonnés, et il a peut-être découvert que cette posture fonctionne bien auprès d’eux
      D’une certaine manière, c’est assez rafraîchissant. Beaucoup de gens critiquent tel ou tel aspect de l’IA, puis terminent par une clause de non-responsabilité du genre « mais en fait j’aime vraiment l’IA et je l’utilise tous les jours »
      Il cherche sans doute à éviter la situation où des builders pragmatiques débarquent dans les commentaires pour livrer calmement de la nuance, autrement dit, dans le jargon actuel, se faire tomber dessus par des guerriers du clavier en colère avec une puce sur l’épaule, et il est épuisant de devoir se frayer un chemin à travers ce faux équilibre
      C’est plus difficile de lui adresser cette critique à Zitron. Quoi qu’on dise de lui, il n’a pas peur de donner l’impression de prendre parti
    • Certaines catégories de personnes semblent incapables de distinguer les trois choses suivantes : 1) elles n’aiment pas l’IA en tant que technologie, 2) elles n’aiment pas les gens et les entreprises qui gagnent de l’argent avec l’IA, 3) elles pensent que l’IA ne sert à rien
      Ce sont trois positions totalement distinctes. On peut penser que l’IA est très utile tout en la détestant parce qu’elle pourrait faire baisser son statut social, ou aimer la technologie tout en estimant que Sam Altman est malhonnête
      Pourtant, beaucoup de polémistes anti-IA semblent curieusement sentir qu’ils doivent avancer les trois arguments à la fois
      Plus drôle encore, si c’était vraiment inutile, il n’y aurait pas lieu de s’en soucier. Le marché finirait par constater l’inutilité, tout reviendrait à la normale et ceux qu’ils détestent perdraient leur argent
      Bien sûr, je ne pense pas qu’ils croient réellement que c’est inutile. Je pense plutôt qu’ils s’inquiètent de l’effet que cela pourrait avoir sur leur prestige, et qu’ils espèrent ardemment qu’un jour tout le monde va « se réveiller » et partager la conviction que les LLM ne sont rien d’autre que des perroquets stochastiques sans utilité. Mais les gens les utilisent tous les jours, et voient en temps réel qu’ils s’améliorent
    • Le coût de l’inférence a de bonnes chances de beaucoup baisser
      Son argument est que, pour que ces entreprises soient rentables, il faudrait que se produisent de très grandes choses sans précédent avant 2022. Je suis globalement d’accord, mais je pense que ces choses se produisent déjà depuis quelques années, donc elles continueront sans doute à se produire
    • L’idée que l’inférence est chère est souvent répétée, mais elle vient surtout de l’ignorance
      Il n’y a absolument aucune raison de croire que l’inférence est chère, en dehors d’une ambiance générale. Les données et l’intuition indiquent que les marges sont élevées
      Cette manière de penser renforce ma conviction que les gens, sans vraiment savoir, utilisent la formule « l’IA n’est pas rentable et coûte trop cher » comme une forme de catharsis face à des avancées énormes
  • Zitron est un acteur dont l’activité n’est pas d’avoir raison dans ses prédictions, mais de produire du contenu
    Peu importe combien de fois lui et d’autres du même genre annoncent que la fin est proche : il leur suffit d’avoir raison une seule fois
    Cela dit, à l’heure actuelle, il a clairement raison sur certains points concernant l’économie. On ne voit toujours pas comment récupérer cet investissement gigantesque

    • Si l’objectif est de produire du contenu, il n’est même pas nécessaire d’avoir raison une seule fois
  • À mes yeux, l’IA va transformer le monde de manière radicale
    Cela peut empirer les choses, les améliorer, ou faire un mélange des deux, mais je n’en doute pas une seconde
    Le bond des LLM n’a commencé qu’il y a 5 ou 6 ans à peine. À titre de comparaison, les ondes radio ont été découvertes en 1886, Marconi les a utilisées pour communiquer en 1895, le téléphone et la radio ont coexisté pendant des décennies, mais la téléphonie mobile et les technologies sans fil n’ont vraiment décollé qu’en 1995
    Si cela a pris si longtemps, ce n’est pas parce qu’il fallait attendre que la physique des ondes radio mûrisse, mais parce que tout le reste nécessaire pour en tirer profit a eu besoin de temps
    Pour moi, les LLM se rapprochent moins de l’IA que de briques de base. Ils pourraient être l’équivalent des ondes radio ou du transistor
    On voit déjà qu’il est possible de relier des LLM pour en faire des agents. Pour l’instant, le prix est la contrainte majeure, aussi bien pour le code que pour les agents
    Si vous ne voulez que Claude Code ou Codex, ça reste à peu près raisonnable, mais il existe beaucoup de combinaisons de LLM que la plupart des gens n’osent même pas expérimenter. Par exemple, faire tourner les dialogues de PNJ et les mécaniques d’un monde de jeu sur des LLM n’est pas encore viable à cause du coût
    Si le prix du matériel d’inférence baisse et que les algorithmes d’inférence continuent de s’améliorer, je suis convaincu — et cela m’effraie aussi — que nous verrons des choses difficiles à imaginer aujourd’hui

    • C’est justement le problème sur lequel je travaille
      Le coût n’est pas le vrai problème. Les réponses et scénarios cohérents dans leur contexte sont en nombre limité, donc un LLM n’a pas besoin de générer du texte en temps réel dans le jeu
      À la place, on peut utiliser un LLM pour produire un énorme corpus d’« atomes » comme des messages de dialogue, des fragments, des indices, puis les assembler de façon déterministe selon les entrées du joueur. On peut aussi faire une revue préalable et divers tests avant l’implémentation
      Pour un joueur qui interagit dans un jeu, un tel système serait, dans le cadre des interactions prévues, difficile à distinguer fonctionnellement d’un texte généré
      Les avantages sont aussi considérables. Si le joueur sort de son rôle et cherche délibérément les coutures, elles peuvent apparaître, mais le système n’est pas exploitable de la même manière qu’un LLM
    • Dire que « l’IA peut changer le monde en bien, en mal, ou les deux » est une affirmation vide de valeur
      Quel éclair de génie que de soupçonner qu’une chose pourrait rendre le monde meilleur, pire, ou les deux à la fois
      Dire aussi que « nous sommes encore trop tôt » est étrange. On a déjà eu plusieurs publicités au Super Bowl, des entreprises qui monopolisent pratiquement l’actualité tech en faisant répéter mot pour mot par des journalistes les absurdités de leurs CEO, et quand elles affirment valoir plus de 1 000 milliards de dollars, les seules personnes ayant autorité pour contester leurs finances semblent simplement acquiescer
      On a construit des data centers de plusieurs centaines d’acres, signé des contrats de data centers qui ne se concrétiseront pas, et réclamé des dizaines de milliards de dollars par mois
      Cela a avalé tout le silicium, au point que les gens voient de leurs propres yeux le prix du matériel doubler, tripler, voire plus
      Des entreprises ont imposé l’usage de l’IA à leurs employés, puis ont fait machine arrière quand les subventions ont disparu et que les coûts réels sont apparus
      Et malgré cela, on nous dit qu’il faudrait encore plus de temps, encore plus d’attention, encore plus de gens qui regardent. Je ne vois pas à quel moment, dans l’histoire des ondes radio, quelque chose de comparable s’est produit
    • Les dialogues de PNJ propulsés par des LLM m’intéressent bien moins que les dialogues et personnages écrits par des auteurs
      La simulation est ennuyeuse
  • Ed voit dans le fait que « l’IA ralentit » un signe lié aux plafonds de dépenses des entreprises, en particulier la limite mensuelle de 1 500 dollars par outil et par ingénieur chez Uber
    J’interprète exactement la même preuve à l’inverse. Il y a un an encore, l’idée qu’une entreprise dépense 1 500 dollars par mois et par employé pour des outils d’IA paraissait absurde, et on se demandait bien ce qu’on pouvait faire avec de l’IA pour arriver à ce montant
    Mais avec l’arrivée des agents de code et des agents de plus en plus généralistes, la demande des employés est devenue si forte que les entreprises ont dû imposer des limites
    Le marché total adressable de ces entreprises d’IA a bondi à 1 500 dollars par mois et par travailleur du savoir, et je ne vois pas en quoi cela ressemble à un ralentissement

    • C’est peut-être envisageable dans certains États où la big tech américaine verse des salaires absurdes aux ingénieurs
      Mais pour obtenir le retour sur investissement attendu, il faudrait dépenser cette somme — ou plus — à l’échelle mondiale, et aucun budget de ce niveau ne passera sur le long terme
      Les entreprises aiment réduire les coûts, et dès qu’elles jugeront qu’il existe une autre façon d’obtenir la même valeur, voire une meilleure, comme lorsqu’elles réduisent leurs effectifs à leur guise, ces budgets disparaîtront vite
      Ou bien ils disparaîtront simplement sous la pression des actionnaires, focalisés sur la valeur à court terme
    • En réalité, ce n’est même pas 1 500 dollars par ingénieur et par mois, mais 1 500 dollars par outil, par ingénieur et par mois
      Autrement dit, rien qu’avec Claude Code et Cursor, on arrive facilement à 3 000 dollars par mois, et si Codex s’ajoute comme option, on peut monter à 4 500 dollars
      Et comme vous l’avez écrit sur votre blog, c’est un plafond souple qu’on peut dépasser si on sait le justifier