33 points par GN⁺ 2025-07-24 | 5 commentaires | Partager sur WhatsApp
  • La bulle IA désigne une situation gonflée de spéculation sans revenus réels, avec une structure très instable sur les plans économique et technologique
  • NVIDIA et une poignée de big tech soutiennent le marché, tandis que la plupart des entreprises de l’IA enregistrent des pertes colossales
  • L’ensemble de l’écosystème dépend excessivement des ventes de GPU, et en pratique la seule entreprise qui gagne vraiment de l’argent est NVIDIA
  • Les effets de l’IA sur la productivité, l’innovation, le remplacement des emplois, etc. sont exagérés, et la plupart des startups fondées sur l’IA survivent sans modèle économique clair ni retour à la rentabilité
  • Le grand capital et les médias entretiennent le fantasme autour de l’IA, alors qu’en réalité le secteur est marqué par des fonctions répétitives et limitées, des coûts élevés et un avenir incertain

Introduction : vigilance face à la « bulle IA »

  • Le véritable journalisme consiste à consigner l’histoire et à diagnostiquer précisément les faits, ainsi qu’à décrire clairement la situation actuelle comme méritant un avertissement
  • L’auteur nourrit de profondes inquiétudes et une forte vigilance à l’égard de l’état actuel de l’industrie de l’IA
  • Ces inquiétudes ne relèvent ni de la faiblesse ni du pessimisme, mais d’un scepticisme sain qui examine de façon critique les bulles du marché, du capital et l’auto-illusion
  • L’auteur, comme d’autres critiques, est exagérément dénigré pour son refus de se conformer à la logique du marché, et accusé de “s’opposer pour s’opposer” ou de chercher le clic
  • Mais le but de cette critique n’est pas simplement d’attirer l’attention : il s’agit de mettre en lumière les exagérations et contre-vérités du secteur, le gaspillage du capital, la destruction de l’environnement et une structure dont seuls quelques-uns profitent
  • Depuis 2021, l’auteur critique régulièrement diverses bulles et manipulations, notamment la vague anti-télétravail, la bulle sociale audio Clubhouse, la bulle NFT, la manipulation autour du Quiet Quitting et l’affaire FTX
  • Il ne s’agit pas d’une simple posture de “frondeur”, mais d’une pensée critique et d’une saine méfiance envers le pouvoir et le capital
  • Au vu de la situation récente, la bulle IA apparaît comme une structure extrêmement fragile, bâtie uniquement sur les attentes du marché, l’ambiance (“vibes”) et une foi aveugle
  • Bien que l’existence de la bulle soit manifeste, le marché continue de la nier ou de la croire bien plus forte et solide qu’elle ne l’est réellement
  • L’auteur se qualifie lui-même de “hater” et affirme sa détestation du gaspillage et des pertes, de la destruction de l’environnement, du marketing mensonger et du mirage du remplacement des emplois
  • Ce texte n’est pas un guide au sens traditionnel, mais un document qui résume de manière condensée les problèmes fondamentaux de la bulle IA et les arguments de sa critique
  • L’auteur se dit écœuré par les faux-semblants de l’industrie de l’IA, le concept d’“agent” qui ne fonctionne pas, les logiciels cloud hors de prix et sans utilité, ainsi que l’exagération selon laquelle “le futur est déjà arrivé”
  • Pour lui, le boom de l’IA générative n’est qu’un mirage dépourvu de chiffre d’affaires, de résultats et d’utilité
  • Lorsque tout cela s’effondrera, il espère qu’on se souviendra qu’il l’avait annoncé à l’avance

Le talon d’Achille des Magnificent 7 : NVIDIA

  • En juillet 2025, l’action NVIDIA est remontée en flèche à 170 dollars, mais elle était tombée sous les 100 dollars en janvier de la même année lors de l’épisode DeepSeek, ce qui montre une réaction extrêmement sensible aux grands événements de marché
  • Les Magnificent 7 (35 % du marché boursier américain) : NVIDIA, Microsoft, Alphabet (Google), Apple, Meta, Tesla, Amazon
    • Parmi eux, la capitalisation boursière de NVIDIA représente 19 % des Magnificent 7
    • Une grande partie des retraites et produits d’investissement des Américains est indexée sur ce groupe de big tech ; l’éclatement de la bulle IA pourrait donc affecter l’économie réelle
  • La dépendance aux principales sources de revenus de NVIDIA est préoccupante
    • Microsoft (18,9 %), Amazon (7,5 %), Meta (9,3 %), Alphabet (5,6 %) et Tesla (0,9 %) représentent 42,4 % du chiffre d’affaires total de NVIDIA
    • Meta consacre 25 % de ses dépenses d’investissement, et Microsoft 47 %, à l’achat de puces NVIDIA
    • Microsoft loue des serveurs à CoreWeave, et de jeunes entreprises du cloud comme CoreWeave et Crusoe contribuent aussi à hauteur de 10 % au chiffre d’affaires de NVIDIA
  • Croissance des résultats trimestriels de NVIDIA
    • Croissance annuelle : 101 %, 94 %, 78 %, 69 % (sur les 4 derniers trimestres)
    • La croissance trimestrielle a fortement ralenti, passant de 69 % à 59 %, puis 12 % et 12 %
    • Le chiffre d’affaires des data centers (principalement les GPU pour serveurs) a atteint 39,1 milliards de dollars, en dessous des attentes du marché (39,4 milliards)
    • Couplé aux problèmes sur le marché chinois (interdiction du H20, etc.), cela expose de plus en plus les limites de la croissance du chiffre d’affaires
  • Les risques de NVIDIA
    • Pour maintenir sa croissance, l’entreprise doit augmenter ses ventes de GPU à chaque trimestre
    • 88 % de son chiffre d’affaires provient des GPU pour data centers (autrement dit, du trade IA), et si les achats continus de 5 à 6 big tech s’interrompent, l’ensemble du marché peut vaciller
    • En réalité, 35 % de la bourse américaine ne “tient” que grâce aux achats de GPU de 5 à 6 entreprises
    • 47,87 % des bénéfices du Russell 1000 proviennent des Magnificent 7 (en 2024)
  • En conclusion, si la croissance de NVIDIA ralentit ou si son chiffre d’affaires est touché, le choc peut se transmettre directement à l’ensemble des Magnificent 7, puis au marché boursier américain et au marché des retraites

The Hollow "AI Trade" (le trade IA creux)

  • Contrairement à l’idée largement répandue selon laquelle “on gagne de l’argent avec l’IA”, en dehors de NVIDIA, pratiquement aucune entreprise ne tire de bénéfices de l’IA générative

Les Magnificent 7 ont injecté 560 milliards de dollars dans les investissements liés à l’IA (Capex) sur 2024-2025, mais cela n’a généré que 35 milliards de dollars de revenus liés à l’IA

  • Si Meta, Amazon, Microsoft, Google et Tesla vont jusqu’au bout de leurs engagements, 560 milliards de dollars d’investissement ne produiront que 35 milliards de dollars de revenus
  • En réalité, la plupart des entreprises n’ont que du “chiffre d’affaires”, sans aucun profit réel
  • Une telle structure de marché est extrêmement irrationnelle et constitue une consommation de capital dangereuse

Microsoft AI Revenue In 2025: 13 milliards de dollars, dont 10 milliards dépensés par OpenAI sur Azure à un “tarif remisé qui couvre à peine le coût d’exploitation des serveurs”

  • Capex 2025 : 80 milliards de dollars

  • En janvier 2025, Microsoft a annoncé un revenu annualisé lié à l’IA de 13 milliards de dollars, mais sur ce total, 10 milliards (environ 77 %) proviennent de l’utilisation de Microsoft Azure par OpenAI
  • Le montant payé par OpenAI correspond à un “tarif fortement remisé qui couvre seulement les coûts d’exploitation des serveurs de Microsoft”, si bien qu’il n’en reste pratiquement aucun bénéfice réel
  • Le “vrai” chiffre d’affaires IA de Microsoft n’est en réalité que d’environ 3 milliards de dollars, soit 3,75 % seulement de ses dépenses d’investissement 2025
  • En 2024 aussi, sur 4,7 milliards de dollars de revenus IA, 2 milliards provenaient d’OpenAI ; sur deux ans, l’entreprise a investi 135,7 milliards de dollars dans l’infrastructure IA, mais sur 17,7 milliards de revenus IA totaux, 12,7 milliards relèvent de transactions internes
  • Au final, l’activité IA de Microsoft est surtout gonflée en apparence, avec des bénéfices réels minimes et largement tirés de transactions internes avec OpenAI

Amazon AI Revenue In 2025: 5 milliards de dollars

  • Capex 2025 : 105 milliards de dollars

  • En 2025, le revenu estimé d’Amazon lié à l’IA s’élève à 5 milliards de dollars, un niveau très faible au regard de ses 105 milliards de dollars de dépenses d’investissement
  • En 2024 déjà, les Capex avaient atteint 83 milliards de dollars, mais les revenus IA réels n’étaient que de 2,77 milliards de dollars
  • Des analystes estiment que les revenus IA d’Amazon pourraient augmenter de 80 %, mais la structure de rendement par rapport à l’investissement reste extrêmement inefficace
  • Le PDG d’Amazon, Andy Jassy, a insisté sur le fait que l’IA constitue la plus grande opportunité commerciale depuis le cloud et le plus grand changement technologique depuis Internet, mais les données réelles n’étayent pas cette affirmation
  • Malgré l’ampleur des capitaux engagés, les limites structurelles d’un modèle incapable de générer des bénéfices significatifs dans l’IA apparaissent clairement

Revenus IA de Google : jusqu’à 7,7 milliards de dollars

  • Dépenses d’investissement (Capex) 2025 : 75 milliards de dollars

  • En 2025, l’estimation maximale des revenus liés à l’IA de Google n’atteint que 7,7 milliards de dollars, et l’estimation des analystes de Bank of America est même plutôt généreuse
  • Sur ce total, 4,2 milliards de dollars proviennent des abonnements IA dans Google Cloud, et 3,1 milliards de dollars du forfait IA premium de Google One
    Le milliard de dollars restant provient d’une hausse de prix rendue possible par l’ajout forcé de fonctionnalités Gemini AI aux services Workspace
  • Le forfait IA premium de Google One ne pourrait générer 3,1 milliards de dollars de revenus qu’en supposant environ 12,9 millions d’abonnés payants, une estimation qui manque de fondement réaliste
  • Les revenus de Workspace soulèvent eux aussi des doutes sur leur croissance durable, puisqu’ils dépendent de l’effet d’une hausse de prix imposée aux utilisateurs professionnels
  • Face à 75 milliards de dollars de dépenses d’investissement liées à l’IA, les revenus IA réels (et non les bénéfices) restent extrêmement faibles

Revenus IA de Meta : 2 à 3 milliards de dollars

  • Dépenses d’investissement (Capex) 2025 : 72 milliards de dollars

  • En 2025, les revenus IA de Meta s’élèvent à 2 à 3 milliards de dollars, un niveau très faible au regard des 72 milliards de dollars d’investissements en infrastructures IA
  • Meta a forcé l’intégration de fonctions d’IA générative (LLM, génération d’images, etc.) dans tous ses principaux services, y compris les DM d’Instagram, mais échoue à les monétiser réellement
  • Selon des documents révélés dans le cadre d’un procès pour violation du droit d’auteur, Meta affirmait viser 460 milliards à 1,4 billion de dollars de revenus IA d’ici 2035, mais cela relève d’une exagération irréaliste
  • 99 % du chiffre d’affaires total dépend de la publicité, et une partie des revenus de licence du modèle Llama pourrait provenir de certains partenaires cloud (AWS, NVIDIA, Google, etc.), mais aucun résultat précis n’a été publié
  • En conséquence, la division IA de Meta ne génère pas de bénéfices à la hauteur des investissements massifs engagés, et ne fait qu’aggraver une énorme consommation de cash et des inefficacités

Tesla ne semble pas gagner d’argent avec l’IA générative

  • Dépenses d’investissement (Capex) 2025 : 11 milliards de dollars

  • Tesla fait partie des Magnificent 7, mais c’est l’entreprise la plus éloignée du trade de l’IA générative
  • Elon Musk s’est lancé dans l’IA avec xAI (développeur de Grok, un LLM emblématique, et propriétaire de Twitter), mais xAI brûle 1 milliard de dollars de cash par mois et n’enregistre qu’un chiffre d’affaires annuel extrêmement faible de 100 millions de dollars (8,3 millions par mois)
  • Les revenus directs de Tesla liés à l’IA sont pratiquement inexistants, et une éventuelle participation dans xAI devrait être décidée par vote des actionnaires, avec un objectif qui semble surtout relever de l’effet de levier personnel de Musk
  • Si le capital de Tesla était injecté dans une activité IA comme xAI, les chances de générer des revenus réels resteraient faibles, tandis que les risques de dégradation du chiffre d’affaires et de la marque de l’activité principale de Tesla augmenteraient
  • En conclusion, Tesla n’est ni un bénéficiaire direct de la vague de l’IA générative, ni une entreprise dont on peut raisonnablement attendre un gain concret lié aux investissements dans l’IA

L’histoire d’Apple avec l’IA est étrange

  • Dépenses d’investissement (Capex) 2025 : environ 11 milliards de dollars

  • Apple est considérée comme l’entreprise la plus réticente à adopter l’IA générative et comme un acteur en retard sur la tendance IA
  • Depuis le lancement des fonctionnalités Apple Intelligence, des millions d’utilisateurs ont au contraire développé une forme de rejet de l’IA, car la plupart des fonctions proposées (résumé de documents, rédaction d’e-mails, emoji personnalisés, etc.) étaient des fonctions dont ils ne voulaient pas réellement
  • Le marché estime qu’Apple a pris du retard dans la concurrence sur l’IA, et que l’adoption forcée de l’IA générative n’a fait qu’augmenter le mécontentement des utilisateurs
  • Malgré cela, Apple n’a pas engagé d’investissements astronomiques dans l’infrastructure IA, et ses dépenses d’investissement liées à l’IA restent relativement faibles, autour de 11 milliards de dollars
  • Dans la mesure où Apple n’a pas parié un capital colossal sur des produits IA au potentiel de marché limité et sans rentabilité, son approche peut au contraire être considérée comme prudente et conservatrice

Les Fragile Five — Amazon, Google, Microsoft, Meta et Tesla — soutiennent le marché boursier américain en finançant le futur récit de croissance de NVIDIA

  • Les Fragile Five, à savoir Amazon, Google, Microsoft, Meta, Tesla, soutiennent le marché boursier américain via leurs achats de GPU NVIDIA
  • La capitalisation de NVIDIA représente environ 8 % de l’ensemble du marché boursier américain et environ 7,5 % du S&P 500 ; 88 % de son chiffre d’affaires provient des GPU d’entreprise pour l’IA générative, dont 42 % dépendent des achats de ces cinq entreprises
  • Si une seule d’entre elles modifiait ses investissements dans les puces NVIDIA, cela pourrait avoir un impact négatif direct et majeur sur l’ensemble du marché américain
  • Dans une situation où les résultats de NVIDIA sont assimilés à la confiance du marché, les services IA qu’elles ont mis en place génèrent en réalité des pertes massives, tout en contribuant à peine à la création de revenus et de profits réels
  • Chaque entreprise parle de « croissance grâce à l’IA » ou de « remplacement des emplois par l’IA », mais ce ne sont que des gestes de diversion pour éviter de publier les vrais chiffres des revenus
  • Si une véritable croissance ou une hausse réelle des revenus existait, elles l’auraient largement proclamée à l’ensemble du marché ; au lieu de cela, elles continuent simplement d’injecter des sommes colossales
  • Au final, l’essence même du boom de l’IA ne réside pas dans de véritables revenus d’activité, mais dans une simple circulation de capitaux autour de l’achat de GPU NVIDIA

Ed ! Il a fallu des années à Amazon Web Services pour devenir rentable ! Les gens disaient qu’Amazon allait échouer !

  • Beaucoup répètent l’argument selon lequel « Amazon a aussi été déficitaire pendant un temps, donc l’IA pourrait elle aussi devenir rentable avec le temps », mais en réalité Amazon Web Services (AWS) et l’industrie de l’IA générative sont fondamentalement différentes
  • Dans l’article Amazon.bomb de Barron’s en 1999, on trouvait déjà une vision sceptique du modèle déficitaire d’Amazon, de l’intensification de la concurrence et de sa capacité à devenir rentable un jour ;
    mais même à cette époque, la demande du marché pour le modèle économique d’Amazon (le commerce en ligne) n’était pas remise en cause
  • AWS a lui aussi connu des pertes autour de son lancement en 2006, mais il existait une demande réelle sur un marché déjà clairement établi (services web, hausse du trafic en ligne), et une fois la croissance enclenchée, l’activité est rapidement devenue rentable
  • Contrairement à AWS, l’industrie de l’IA générative n’a toujours pas démontré l’existence d’un modèle économique solide et rentable, ni d’une demande de masse avérée
  • Ce n’est pas parce que le scepticisme passé envers Amazon s’est révélé erroné qu’il faut aujourd’hui considérer avec optimisme les critiques de l’industrie de l’IA en affirmant qu’« elle finira bien par devenir rentable un jour » : c’est une mauvaise comparaison qui ignore des contextes fondamentalement différents

Mais parlons d’Amazon Web Services

  • Amazon Web Services (AWS) est à l’origine une activité dérivée du processus par lequel Amazon.com a fait évoluer en interne ses propres capacités pour absorber l’explosion du trafic web et la complexité croissante de son infrastructure de services
  • Nous étions au début de l’ère d’Internet (avant l’arrivée de Facebook et Twitter), et AWS a créé un nouveau marché en étant le premier à proposer une véritable innovation d’infrastructure avec le cloud computing, la location de serveurs, le stockage, etc.
  • Dès un article de Bloomberg en 2006, cela était présenté comme le « pari risqué » de Bezos, et AWS faisait face à un fort scepticisme de Wall Street et des investisseurs
  • Pourtant, à l’époque déjà, l’infrastructure matérielle et logicielle était en place, et la direction exprimait clairement une vision de long terme : une fois plusieurs années de lourds investissements initiaux terminées, l’activité commencerait vraiment à produire des résultats
  • À l’époque, l’analyste Scott W. Devitt estimait avec pessimisme qu’« il n’y aurait aucun rendement économique pendant des années », mais
    en réalité AWS a rapidement capté une demande de marché claire et préexistante (services d’infrastructure IT pour les entreprises et les développeurs) et est parvenu à devenir rentable avec succès
  • Aujourd’hui encore, dans le boom de l’IA, de nombreux analystes parient avec optimisme sur le fait que l’IA générative deviendra une industrie rentable comme AWS, mais
    en réalité même de grandes entreprises IT comme Salesforce ou Palantir ont officiellement déclaré ne voir aucun signe d’amélioration des profits dans leurs activités IA
  • La différence fondamentale est qu’AWS s’est développé sur la base d’un marché et de besoins clairement identifiés, alors que les services d’IA générative reposent sur des attentes exagérées sans que la demande réelle ni le modèle économique aient été prouvés
  • Cela souligne aussi que les analystes peuvent se tromper massivement, et qu’il est dangereux d’espérer le succès des activités IA sur la seule base de l’optimisme du marché

Mais AWS aussi coûtait de l’argent, Ed, et voici maintenant ta fin !

  • AWS aussi s’est développé en supportant pendant longtemps des pertes et un énorme poids en investissements d’équipement (Capex),
    et jusqu’à son passage à la rentabilité en 2015, de nombreux analystes (par exemple Katy Huberty)
    estimaient encore avec pessimisme qu’« AWS subit toujours de lourdes pertes » et que sa « contribution aux bénéfices est faible »
  • En 2014, une grande partie des 4,9 milliards de dollars d’investissements d’équipement d’Amazon a été consacrée à AWS, mais
    au final, avec 67,6 milliards de dollars d’investissements cumulés sur dix ans, AWS est devenu
    une activité d’infrastructure géante générant des milliards de dollars de profits par trimestre
  • À titre de comparaison, 67,6 milliards de dollars restent inférieurs aux investissements d’équipement d’Amazon dans l’IA en 2024 (83 milliards de dollars),
    et ne représentent même qu’1/15 du total des investissements d’Amazon dans l’IA en 2025
  • Autrement dit, même le coût de la croissance d’AWS ne représente qu’une fraction infime du capital injecté dans le boom actuel de l’IA
  • À l’inverse, l’industrie de l’IA générative engloutit déjà des dizaines voire des centaines de milliards de dollars en très peu de temps, sans avoir démontré ni sa rentabilité ni sa réalité de marché
  • En résumé, AWS d’hier et l’IA générative d’aujourd’hui diffèrent fondamentalement par le capital engagé, le potentiel de marché et la clarté de leur croissance
  • L’ampleur et la vitesse des investissements actuels dans l’IA sont sans commune mesure avec l’époque d’AWS

Generative AI and Large Language Models Do Not Resemble Amazon Web Services or The Greater Cloud Compute Boom, As Generative AI Is Not Infrastructure

  • Beaucoup de gens mettent l’IA générative et les grands modèles de langage (LLM) sur le même plan que les activités d’infrastructure cloud comme AWS, Azure ou Google Cloud, mais en réalité ces deux types d’activité sont fondamentalement très différents
  • Les services cloud comme AWS fournissent de manière souple une véritable infrastructure IT, comme EC2 (location de calcul) ou S3 (location de stockage), et génèrent déjà des dizaines de milliards de dollars de revenus sur le marché des entreprises
    Il s’agit d’une activité de base portée par une demande claire et une forte utilité pour les entreprises et les développeurs
  • La nature même de l’infrastructure cloud est de permettre d’exploiter des services à moindre coût et de manière fiable, partout dans le monde, en supprimant pour les clients la nécessité de construire et d’exploiter eux-mêmes leur infrastructure
  • La croissance d’AWS s’est produite parce qu’AWS a résolu efficacement des problèmes et des besoins déjà existants, comme l’essor du commerce en ligne et l’augmentation du trafic des services web
    • Autrement dit, un besoin métier clair et une demande de marché explicite existaient en amont
  • À l’inverse, les activités liées à l’IA générative et aux LLM, au-delà de l’énorme coût des data centers et des GPU, manquent de diversité et de polyvalence en tant qu’infrastructure, ainsi que d’une demande de marché clairement établie
    • En pratique, la plupart des startups IA restent de toute façon obligées de s’appuyer sur une « vraie » infrastructure comme AWS ou Azure
  • En conclusion, l’IA générative n’est qu’une fonctionnalité (Feature) du cloud,
    et elle n’a jamais prouvé qu’elle pouvait devenir une infrastructure générale servant de base à de multiples industries et produits comme le cloud
    Comparer le boom de l’IA à une innovation d’infrastructure relève d’une erreur logique

Companies Built On Top Of Large Language Models Don't Make Much Money (In Fact, They're Likely All Deeply Unprofitable)

  • Les entreprises fondées sur l’IA générative (LLM) sont presque toutes déficitaires. Midjourney a exceptionnellement affirmé être rentable en 2022, mais la situation est aujourd’hui incertaine
  • En dehors de OpenAI, Anthropic et Cursor (Anysphere), aucune entreprise ne dépasse les 500 millions de dollars de chiffre d’affaires annuel
  • Seules quelques-unes, comme Midjourney, Ironclad ou Perplexity, se situent entre 100 et 200 millions de dollars de chiffre d’affaires annuel, et il n’existe dans le monde que 12 entreprises d’IA générative dépassant les 100 millions de dollars de revenus
  • Parmi elles, certaines ont déjà été rachetées, et 7 plafonnent à un niveau d’au moins 50 millions de dollars de chiffre d’affaires annuel
  • Comparée au marché du SaaS et du logiciel d’entreprise, cette échelle de revenus reste très modeste (par exemple Hubspot affiche 2,6 milliards de dollars de chiffre d’affaires annuel)
  • Trois ans plus tard, même les leaders comme OpenAI ou Anthropic affichent encore des pertes de plusieurs milliards de dollars, et les entreprises en croissance manquent à la fois de popularité grand public et de rentabilité
  • Même Cursor, souvent cité comme exemple phare, avec 500 millions de dollars de revenus, révèle un modèle économique non viable en raison d’une politique tarifaire excessive et de limitations de service

Cursor's $500 Million "Annualized Revenue" Was Earned With A Product It No Longer Offers, And Anthropic/OpenAI Just Raised Their Prices, Increasing Cursor’s Costs Dramatically

  • Les 500 millions de dollars de revenus annualisés de Cursor proviennent en réalité d’un service qui n’est plus commercialisé, et qui n’était pas viable
  • En juin 2025, Anthropic et OpenAI ont augmenté les prix de leurs API et introduit des structures de service avec niveaux et priorisation, ce qui a fortement accru les coûts d’exploitation de Cursor
  • En conséquence, Cursor a enchaîné la mise en place de politiques défavorables aux utilisateurs, comme des abonnements modifiés, des restrictions d’usage et des limitations de vitesse
  • La croissance spectaculaire des revenus de Cursor reposait sur une politique tarifaire déraisonnable et totalement dépourvue de rentabilité, ainsi que sur des conditions d’utilisation des modèles intenables ; cela n’étant plus soutenable, la qualité et les conditions du service se sont dégradées
  • En pratique, la majeure partie des fonds levés par Cursor est versée à des fournisseurs de LLM comme OpenAI et Anthropic
  • Dans un tel environnement, aucune startup IA ne peut facilement construire un modèle économique pérenne, et le cas de l’hypercroissance de Cursor finit lui aussi par apparaître comme une “fausse croissance”

> Non, sérieusement, où sont les startups d’IA grand public ?

  • La startup d’IA grand public la plus emblématique, Perplexity, n’affiche que 150 millions de dollars de revenus annualisés et,
    en 2024, a versé à Anthropic, OpenAI et Amazon l’équivalent de 167 % de son chiffre d’affaires, enregistrant ainsi une perte de 68 millions de dollars
  • En réalité, il n’existe presque aucun exemple de service d’IA générative grand public correctement monétisé
  • La plupart des nouveaux services IA se limitent à reproduire des fonctions déjà présentes dans la recherche, l’automatisation, les chatbots ou d’autres SaaS existants, sans produire d’innovation réelle ni créer de « nouveau marché »

The Generative AI Software As A Service Market Is Small, With Little Room For Growth And No Profits To Be Seen

  • Le marché du SaaS d’IA générative est globalement très petit, et il n’existe aucune entreprise à la fois en forte croissance et rentable
  • Le secteur met l’accent non pas sur les revenus réels, mais uniquement sur le « revenu annualisé » (Annualized Revenue), ce qui limite l’évaluation de la croissance réelle et de la pérennité lorsque le revenu mensuel est faible ou que l’attrition des abonnés est élevée
  • Converti en revenus mensuels, la plupart des entreprises restent sous les 10 millions de dollars, et même comparé au revenu mensuel d’AWS en 2008 (15,75 millions de dollars), le rythme de croissance est très en retard
  • En dehors de Cursor, il n’existe pas d’entreprise SaaS vraiment marquante, et même celles qui se présentent comme les « plus fortes croissances » utilisent des politiques tarifaires opaques et de faux indicateurs de croissance
  • Même Glean, SaaS phare de la recherche IA, malgré des levées de fonds successives en 2024 et 2025 et l’annonce d’un « ARR de 100M », montre une stagnation du revenu mensuel et de la croissance réelle, ainsi que des hausses de prix soudaines : absence de véritable potentiel de marché comme de forte croissance
  • Dans l’ensemble, le marché du SaaS d’IA générative est étroit, sans réel potentiel de croissance, et aucune entreprise n’a encore réussi à atteindre la rentabilité

There Are No Unique Generative AI Companies — And Building A Moat Based On Technology Is Near-Impossible

  • Les entreprises d’IA générative proposent presque toutes les mêmes fonctions (chatbots, recherche et résumé, génération de texte ou d’images, traduction, assistance au code, etc.), et la différenciation technologique est extrêmement difficile
  • Au final, la plupart des entreprises dépendent des mêmes API de LLM (OpenAI, Anthropic, etc.), et la propriété intellectuelle (IP) essentielle appartient elle aussi aux fournisseurs de LLM
  • Même un cas de croissance comme Cursor n’offre aucune différence substantielle en dehors de l’UI, des prompts et de la politique tarifaire, tandis que des concurrents comme Amazon ou ByteDance peuvent lancer facilement des produits similaires
  • Le design de service et l’exploitation ne peuvent pas constituer une barrière technologique à l’entrée (moat), et les fournisseurs de modèles peuvent créer un service clone à tout moment s’ils le souhaitent
  • En conséquence, il n’existe pas de startup d’IA générative réellement originale, ni de cas ayant réussi à bâtir un véritable « moat »

Established Large Language Models Are A Crutch

  • Lors des précédents booms technologiques, chaque entreprise développait ses propres modèles et sa propre infrastructure, alors qu’à l’ère de l’IA générative, presque toutes les startups dépendent d’un petit nombre de grands LLM (OpenAI, Anthropic, etc.)
  • Le marché finit donc par se déformer en une structure centrée sur deux ou trois entreprises, les autres se contentant d’ajouter une couche logicielle fonctionnelle comme des sous-traitants

OpenAI And Anthropic Are Their Customers' Weak Point

  • Les fournisseurs de LLM comme OpenAI et Anthropic peuvent modifier unilatéralement leurs prix et conditions de service à tout moment, et comme l’a montré le cas du blocage de Windsurf, ils menacent directement l’activité de leurs clients
  • Leurs clients sont entièrement dépendants des changements de politique des fournisseurs de LLM

The Limited Use Cases Are Because Large Language Models Are All Really Similar

  • Tous les grands modèles de langage utilisent pratiquement les mêmes données et la même architecture (Transformer, etc.), ce qui limite fortement la différenciation fonctionnelle comme la diversité des cas d’usage

Generative AI Is Simply Too Expensive To Build A Sustainable Business On Top Of It

  • La structure de coûts — coûts d’exploitation, coûts d’API, etc. — est beaucoup trop lourde et difficile à prévoir
  • OpenAI, Anthropic, Perplexity et les autres subissent tous un poids énorme des coûts de maintien par rapport à leurs revenus, au point de rendre presque impossible un modèle économique durable

Companies Are Using The Term "Agent" To Deceive Customers and Investors

  • Le terme « agent IA » s’apparente en réalité davantage à une escroquerie marketing qui habille de manière convaincante des chatbots non autonomes ou des flux d’automatisation
  • Des exemples représentatifs comme Agentforce de Salesforce, ChatGPT Agent d’OpenAI, Glean ou ServiceNow ne fournissent, sous l’étiquette « agent IA », que de simples chatbots ou des fonctions d’automatisation basées sur du IF-THEN
  • En pratique, le taux de réussite n’est que de 58 % pour les tâches à une seule étape et de 35 % pour les tâches à plusieurs étapes, et il ne s’agit en aucun cas de véritables agents capables de remplacer l’humain
  • Même les agents de code dépendent en pratique de la supervision humaine pour l’exécution, les erreurs et le contrôle qualité
    • Selon des résultats de recherche réels, les outils de code IA réduisent la productivité des développeurs de 19 %
  • Le terme « agent IA » lui-même n’est qu’une formule symbolique exagérée destinée à induire en erreur clients et investisseurs, et les médias le reprennent eux aussi sans esprit critique

But Really Though, Everybody Is Losing Money On Generative AI, And Nobody's Making A Profit

  • Selon un rapport d’UBS, les revenus liés à l’IA des entreprises cotées qui exploitent réellement des services IA sont extrêmement faibles
  • Par exemple, la valeur annuelle contractuelle (ACV) liée à l’IA de ServiceNow n’atteint que 250 millions de dollars, et il n’est même pas clair qu’il s’agisse d’un revenu réellement attribuable à l’IA seule
  • Gartner prévoit que plus de 40 % des projets d’« agents IA » seront abandonnés avant terme d’ici 2027
  • Adobe, Salesforce et d’autres font eux aussi beaucoup de promotion autour de l’IA générative, mais leurs revenus annualisés tournent autour de 100 millions de dollars ; compte tenu des coûts, les bénéfices réels sont quasi nuls ou proches des pertes
  • Un tel niveau de revenus est absurdement faible pour prétendre piloter une industrie du futur, et il n’existe ni véritable rentabilité ni réel potentiel de marché

OpenAI and Anthropic Are The Generative AI Industry, Are Deeply Unstable and Unsustainable, and Are Critical To The AI Trade Continuing

  • OpenAI et Anthropic représentent à eux deux plus de la moitié des revenus de l’industrie de l’IA générative, mais leur structure est extrêmement instable puisqu’ils enregistrent des pertes annuelles de plusieurs milliards de dollars
  • OpenAI est en train de lever 40 milliards de dollars auprès de SoftBank et d’autres, dont 30 milliards restent encore non sécurisés
    • Une part importante de ces fonds doit être investie dans des data centers (par exemple Stargate), mais la capacité réelle à lever ces capitaux reste incertaine
    • En cas d’échec de sa transformation en société à but lucratif d’ici 2025, OpenAI perdrait 20 milliards de dollars sur les 20 milliards concernés, et si cette transformation n’est pas réalisée d’ici octobre 2026, l’ensemble de l’investissement serait converti en dette
    • Les négociations avec des investisseurs majeurs comme Microsoft sont elles aussi dans l’impasse
  • Anthropic, de son côté, affiche également 4 milliards de dollars de revenus annuels pour 3 milliards de pertes, et répète les hausses de prix ainsi que les restrictions de service envers des clients majeurs comme Cursor
    • Une structure d’activité instable, sans rentabilité ni durabilité
  • Ces deux entreprises représentent plus de 50 % du chiffre d’affaires total de l’IA générative, mais reposent en réalité entièrement sur une structure déficitaire sans profit
  • Sans financement externe et sans expansion continue de l’infrastructure, leur simple survie reste incertaine : une « industrie à risque »

There Is No Real AI Adoption, Nor Is There Any Significant Revenue

  • L’adoption réelle à grande échelle des services d’IA générative et des revenus significatifs sont presque inexistants
  • ChatGPT met en avant 500 millions d’utilisateurs hebdomadaires, mais les abonnés payants réels ne seraient que de 15,5 millions, dont une part importante correspond à des usages ponctuels ou à des usages d’étude et de devoirs, non professionnels
  • Google Gemini et d’autres gonflent aussi leurs chiffres d’utilisateurs réels en les agrégeant avec Google Assistant, entre autres, si bien que le taux réel de pénétration du marché est bien plus faible
  • Malgré trois ans durant lesquels le secteur, les médias et le marché de l’investissement ont porté la vague IA, les revenus, abonnements et l’écosystème restent nettement inférieurs à ceux du SaaS traditionnel
  • En dehors de ChatGPT, il n’existe pratiquement aucun service d’IA générative ayant obtenu des revenus ou une base d’utilisateurs réellement significatifs sur le marché

Yes, Generative AI "Does Something," But AI Is Predominantly Marketed Based On Lies

  • Il est vrai que l’IA générative offre un certain niveau de fonctionnalités (codage, recherche, etc.), mais toutes les entreprises du secteur sont déficitaires ;
    en l’absence d’une seule entreprise rentable, on ne peut pas parler d’une véritable industrie
  • Des termes comme « agent », « AGI », « singularité » sont employés à outrance pour exagérer les choses, comme si les LLM réalisaient des innovations autonomes et intelligentes
  • L’affirmation selon laquelle l’IA remplace les emplois humains n’est elle aussi qu’une exagération/distorsion intentionnelle visant à faire monter les valorisations et les cours de Bourse
  • En réalité, la plupart des médias et de la communication d’entreprise gonflent les capacités de l’IA au-delà du réel, induisant en erreur les investisseurs et le grand public
  • Même les comportements des modèles comme le mensonge ou la tromperie résultent d’invitations intentionnelles via des prompts, mais les médias s’en servent pour exagérer leur autonomie et leur dangerosité
  • Dans l’ensemble, le marché de l’IA générative repose en grande partie sur l’illusion consistant à emballer une industrie qui génère réellement 50 milliards de dollars de chiffre d’affaires comme une industrie d’avenir valant 1 000 milliards de dollars, et les médias contribuent eux aussi à former cette bulle

The AI Trade Is Entirely About GPUs, And Is Incredibly Brittle As A Result

  • Les transactions sur les actions liées à l’IA se font sans rapport avec les bénéfices, la croissance du nombre d’utilisateurs ou l’innovation technologique
  • Les entreprises ne voient pas leur action monter parce qu’elles gagnent de l’argent avec l’IA, mais à cause de l’image et de l’ambiance associées à l’IA
  • OpenAI et les entreprises construites autour d’elle sont extrêmement fragiles sur le plan économique ; le coût d’exploitation des grands modèles de langage est trop élevé, et il est fondamentalement difficile d’en tirer une innovation réellement différenciante
  • Aujourd’hui, l’ensemble de l’industrie de l’IA dépend entièrement de la vente de GPU
  • CoreWeave, Oracle, Meta, entre autres, achètent de grandes quantités de GPU à NVIDIA, et Microsoft exploite lui aussi une infrastructure Azure massive basée sur des GPU NVIDIA pour soutenir OpenAI
  • Microsoft, Meta, Google, Apple, Amazon et Tesla ne tirent tous aucun profit concret de l’IA, et la progression de leurs actions est elle aussi portée par l’image liée à l’IA
  • Au final, tout ce mouvement dépend de la capacité de NVIDIA à vendre des GPU, tandis que les produits d’IA eux-mêmes n’apportent pas de valeur économique significative. Même lorsqu’ils sont un peu adoptés, ils fonctionnent pour la plupart au prix de pertes sévères

I'm Alarmed!

  • L’industrie de l’IA est actuellement dans un état de bulle évident
  • Certaines analyses estiment que la surévaluation actuelle des 10 plus grandes entreprises du S&P 500 est plus grave encore que lors de la bulle Internet des années 1990
  • L’IA générative ne contribue presque pas à de véritables résultats business, à l’acquisition d’utilisateurs, à l’automatisation du travail ni à la création de valeur réelle. La plupart des entreprises ne parviennent pas à dégager de bénéfices et subissent au contraire de lourdes pertes
  • Cette bulle n’est pas seulement un problème de capital financier, mais une structure symbolique reposant uniquement sur la vente continue de GPU. En pratique, l’espace et le capital nécessaires pour remplir les data centers de GPU sont eux aussi limités
  • Malgré les discours sur la baisse des coûts ou sur l’adoption d’ASIC (puces à usage spécifique), il existe un manque de preuves concrètes ainsi que des difficultés de production et de déploiement. Jusqu’ici, la dépendance aux GPU de NVIDIA demeure
  • Les médias et l’ambiance de marché alimentent un mythe de réussite de l’IA sans substance, en détournant le regard de l’absence réelle d’innovation et de rentabilité
  • NVIDIA est à la fois la force motrice du marché et sa plus grande faiblesse. Tout le monde s’appuie sur NVIDIA pour acheter des GPU à grande échelle, mais en réalité les pertes commencent dès leur installation
  • Les produits fondés sur les grands modèles de langage se ressemblent tous et, malgré des coûts énormes, n’aboutissent qu’à des rendements négatifs
  • La structure actuelle de l’industrie de l’IA diffère d’Uber, d’AWS et d’autres cas passés ; c’est une structure particulière née de l’épuisement des idées dans la tech et l’industrie, ainsi que d’une dépendance excessive à une seule entreprise
  • On a toujours demandé aux sceptiques de l’IA de s’expliquer, mais les optimistes de l’IA sont incapables d’apporter des preuves substantielles
  • Quand la bulle éclatera, l’illusion fondamentale de l’industrie de l’IA apparaîtra au grand jour
  • Réponse à « Les coûts d’inférence baissent ? »

    • La baisse du prix unitaire par token ne signifie pas automatiquement une baisse des coûts d’inférence. Plus le modèle est grand, plus le coût réel augmente au contraire
    • En pratique, les modèles très orientés raisonnement (par exemple Claude Opus 4, etc.) se traduisent par une hausse des coûts d’exploitation
  • Scepticisme face à « L’adoption d’ASIC est la solution ? »

    • OpenAI, Broadcom et d’autres cherchent à développer leurs propres ASIC, mais de nombreux problèmes restent non résolus : faisabilité de la production, performances réelles, compatibilité avec l’architecture serveur, etc.
    • Microsoft a lui aussi déjà connu des échecs dans le développement d’ASIC fiables
    • Même si le passage aux ASIC réussissait, si les ventes de GPU NVIDIA baissent, c’est toute la dynamique de l’IA qui vacille
  • Le risque fondamental de la bulle

    • À l’heure actuelle, l’industrie de l’IA, sans innovation concrète ni véritable barrière à l’entrée infrastructurelle (moat), maintient ses cours et ses valorisations en s’appuyant sur les médias et la psychologie du marché
    • Les seuls cas historiques comparables sont la bulle Internet et l’effondrement de WeWork, entre autres
    • Le marché s’accroche uniquement à la poursuite des ventes de GPU de NVIDIA. C’est une structure où les pertes commencent dès l’installation
    • Au final, tous les produits et business models fonctionnent de manière similaire, dans un cercle vicieux de coûts élevés et de faibles revenus
  • À l’intérieur comme à l’extérieur du secteur, il n’y a que de l’optimisme sans substance, et les usages réels comme l’innovation de l’IA sont exagérés
  • Si la bulle IA éclate, ceux qui ont jusqu’ici tenu un discours optimiste sans fondement devront en répondre

I Don't Like What's Happening : Je n’aime pas ce qui se passe en ce moment

  • L’industrie technologique devrait viser l’innovation, des revenus réels et une véritable croissance, mais l’IA générative actuelle montre une réalité où le marché et les médias sont obsédés par le fantasme du remplacement du travail humain
  • Comme le soutient la thèse de la Rot Economy (« économie pourrie »), indépendamment de la valeur réelle ou de la qualité des produits, l’obsession de la croissance à tout prix a transformé les LLM et les GPU en simples moyens de dépenser de l’argent. En pratique, on continue seulement à acheter des data centers et des puces tout en fabriquant des produits que personne n’aimerait vraiment
  • L’industrie actuelle de l’IA repose sur une structure très fragile et dangereuse. L’ensemble du marché vacille selon que quatre ou cinq entreprises continuent ou non d’acheter des puces. Les GPU qui génèrent des pertes dès leur installation, les produits LLM sans différenciation réelle et les déficits persistants constituent le problème de fond
  • Les adorateurs de l’IA générative, ainsi qu’une partie des médias et des dirigeants, adoptent systématiquement une attitude méprisante envers les avis critiques et entretiennent l’illusion au lieu d’expliquer l’utilité réelle ou l’innovation. Ils affirment que l’IA est extraordinaire, mais manquent de fondements concrets
  • Les LLM ne savent pas distinguer le vrai du faux et transmettent des informations erronées avec autorité. Les dirigeants et managers s’en servent pour donner l’impression d’être devenus plus intelligents grâce à l’IA, tout en évitant le véritable apprentissage et la responsabilité
  • La plus grande illusion de l’IA générative est l’illusion d’activité économique. En réalité, elle ne crée pas de valeur significative, mais fournit un prétexte pour investir des sommes colossales dans les GPU et les data centers, ne faisant qu’amplifier la bulle
  • Cette structure n’a rien à voir avec Uber, AWS ou d’autres cas industriels du passé. Les ventes de matériel d’une seule entreprise dépendent de quatre ou cinq sociétés, et un simple changement de perception peut faire tomber un immense jeu de dominos
  • La direction actuelle mène à du gaspillage et de la destruction inutiles. Les retraites et les emplois de nombreuses personnes ont disparu, tandis que les grands groupes engagent des dépenses astronomiques dans les data centers et les GPU afin d’habiller leurs chiffres de croissance trimestrielle
  • En fin de compte, les responsables de cette confusion du marché existent bel et bien, et c’est l’ensemble du secteur qui en subira les dégâts. Dans ce processus, il est important non pas d’inculquer la peur et la méfiance aux gens, mais d’identifier précisément les véritables responsables
  • Sam Altman, Dario Amodei, Satya Nadella, Sundar Pichai, Tim Cook, Elon Musk, Mark Zuckerberg, Andy Jassy et d’autres portent une responsabilité dans la conduite de cette structure économique inutile et destructrice
    • Une fois la bulle éclatée, ils devront impérativement en répondre
  • Le grand public peut lui aussi comprendre suffisamment bien cette structure et doit prendre conscience que le pouvoir ou le capital ne signifient pas nécessairement avoir raison ni être sage, afin de construire un avenir meilleur

5 commentaires

 
dojanmail 2025-07-28

Les LLM ne sont certes pas sans défauts, mais il me semble difficile d’affirmer que tous les services d’IA sont dépourvus de rentabilité. Je pense que, dans les cinq prochaines années, la quasi-totalité des services de plateforme actuels sera remplacée par des agents IA.

 
ndrgrd 2025-07-25

Si les LLM sont vraiment devenus utiles mais que quelqu’un les dénigre et les évite volontairement sans même les avoir essayés, le problème vient de cette personne,
mais la qualité actuelle des services grand public est à un niveau où ils sont difficiles à utiliser.

J’ai essayé les modèles payants de services connus comme Perplexity, GPT ou Gemini, mais au final ils se valent tous.
Même quand on cherche soi-même les sources, qu’on ajoute des liens et qu’on leur mâche le travail avec les données nécessaires, ils ne les lisent même pas correctement, inventent du contenu et répètent seulement des affirmations erronées.
Ils ont aussi tous une forme d’entêtement absurde : une fois qu’ils commencent à soutenir une affirmation fausse, il devient impossible de les corriger. Il est simplement plus rapide de jeter toute la conversation et de recommencer de zéro.

Honnêtement, c’est agaçant de se chamailler avec un truc pareil. Ça ne comprend pas ce qu’on lui dit.
Pendant ce temps-là, il est plus rapide d’aller chercher soi-même la documentation, de trouver la réponse et de corriger directement.

J’ai aussi essayé plusieurs services de type Copilot pour en choisir un, mais j’ai fini par tous les abandonner.
Ils sont bons pour des tâches au niveau du snippet, mais il est difficile d’en attendre davantage. Dans ce cas, à quoi bon partager ses données et utiliser un service connecté à un Internet d’une lenteur exaspérante ? Autant enregistrer quelques snippets de plus.

Ceux qui disent avoir eu une bonne expérience, je ne sais pas quels services ils ont utilisés ni pour des tâches de quelle complexité.

 
3ae3ae 2025-07-25

D’après mon expérience avec Claude Code, j’ai eu moins l’impression qu’un agent développait à ma place que celle d’externaliser uniquement la partie du processus de développement où l’on tape effectivement le code.

La conception doit souvent être faite par un humain, et les consignes doivent être données de façon suffisamment détaillée pour que n’importe qui puisse les suivre telles quelles, donc c’était assez différent de ce que j’avais entendu.

Cela dit, je l’utilise avec satisfaction. Même si ça ne réduit pas énormément ma charge de travail, le fait de pouvoir faire autre chose ou donner des instructions à une autre IA pendant qu’elle travaille m’a aidé à gagner du temps.

Si vous utilisez Claude Code, je vous recommande d’inclure dans le prompt des mots-clés d’inférence prédéfinis comme think deeply ou ultrathink, puis de passer en plan mode avec Shift+Tab pour travailler ainsi.

 
argo9 2025-07-24

Quand VisiCalc, Lotus 1-2-3 et ce genre de choses sont sortis, il y avait encore des gens qui faisaient leurs calculs au boulier ou à la calculatrice... Il existe un décalage temporel plus grand qu’on ne le pense dans la manière dont le grand public perçoit concrètement ces évolutions.

 
GN⁺ 2025-07-24
Avis Hacker News
  • J’ai dit ceci à un ami en juillet 2023 : « Franchement, je suis sceptique vis-à-vis de l’IA. L’IA et les LLM sont un peu intéressants, mais comme les voitures autonomes il y a 5 ans, ils sont au sommet d’une mode surévaluée fabriquée par le capital-risque, et j’ai l’impression que la bulle va bientôt éclater. Ce qui m’intéresse dans la technologie, c’est quand l’innovation devient réellement utile aux gens, et à ce stade je n’arrive pas à imaginer d’usage bénéfique qui aille au-delà de quelques améliorations marginales dans la consommation de contenu. Ce qu’elle fait le mieux, c’est produire du contenu plausible, mais en pratique tous les résultats générés doivent être minutieusement vérifiés par des experts à cause des erreurs, fautes et “hallucinations”. Si une usine sortait des produits défectueux comme ChatGPT, elle serait immédiatement fermée. Internet a déjà un énorme problème de contenus médiocres, voire trompeurs, et l’idée d’en produire automatiquement encore plus ressemble à un cauchemar. En plus, il est très probable que les jeux de données d’entraînement couramment utilisés contiennent, sans autorisation, les écrits d’innombrables créateurs, et ces systèmes recrachent au final des mensonges bien emballés fabriqués à partir du travail de ces créateurs, sans rémunération ni attribution. Ça me met vraiment mal à l’aise ! » Je me demande à quelle vitesse cette “spectacular deflation” de la bulle va arriver. J’ai traversé environ trois grandes bulles technologiques dans ma vie, et mon instinct me dit que le moment n’est plus très loin

    • l’idée qu’un usage utile ne peut pas dépasser quelques améliorations mineures dans la consommation de contenu<p>AlphaFold a un impact majeur dans la recherche médicale. L’IA ne se résume pas aux chatbots<p>Pour voir comment AlphaFold 3 est utilisé dans la découverte de médicaments, cet article vaut le détour. Ma petite sœur a la SLA, donc le sujet m’intéresse personnellement. J’espère qu’une percée in silico sera ce qui pourra la sauver

    • l’idée que tous les résultats générés doivent être minutieusement vérifiés par des experts<p>Non, il suffit de publier. Si les gens signalent les erreurs, l’algorithme considère aussi ces commentaires comme des interactions positives. C’est une réalité décevante pour ceux à qui ça tient vraiment à cœur

  • Moi aussi, j’ai de profondes réserves sur l’allocation économique actuelle, mais ce genre de chose a toujours existé dans les nouvelles frontières<p>Dans l’IA, les gens négligent le fait que l’architecture transformer est fondamentalement un processus extractif qui identifie et exploite des relations sémantiques dans de grands jeux de données<p>Les données culturelles humaines contiennent une énorme quantité d’informations inférées qui n’apparaissent pas en surface, si bien que beaucoup de gens intelligents prennent cela à tort pour un mécanisme génératif<p>C’est pourquoi tout le domaine est appelé IA “générative”, alors qu’en réalité ce n’est jamais véritablement génératif. Cela se contente d’extraire des significations cachées puis d’extrapoler à partir d’une valeur de départ<p>Il y a beaucoup de domaines où ce mécanisme est utile. Il existe énormément de tâches qui n’exigent pas de créer un sens nouveau ni une nouvelle histoire<p>On peut automatiser du travail manuel en appliquant à des données des schémas sémantiques existants, sans même avoir à spécifier complètement l’algorithme nécessaire pour atteindre l’objectif<p>Un algorithme universel, comme un tournevis sonique : si on lui donne suffisamment de problèmes et d’exemples de solutions, l’algorithme caché est aspiré dans les paramètres du modèle, qui peut alors résoudre toute une famille de problèmes déjà entièrement élucidés<p>Cela dit, ça fonctionne surtout pour des classes de problèmes déjà bien résolus. Pour des problèmes non résolus, on peut éventuellement tenter des approches avec cet outil si le problème se prête à un cadre génération-vérification

    • Des algorithmes différents remplissent des rôles différents. L’IA “générative” peut réellement produire de nouvelles histoires ou images, et certains problèmes qui ne sont pas totalement résolus (par ex. le repliement des protéines) peuvent aussi être traités avec des algorithmes spécifiques
  • Je pense que cette bulle est une “bonne” bulle, comme la bulle ferroviaire du XIXe siècle ou la première bulle internet, dans le sens où elle aboutira à des investissements d’infrastructure qui créeront énormément de valeur à terme<p>Cela dit, tous les LLM sont interchangeables (il n’y a pas de vraie barrière de différenciation), et l’essentiel des revenus viendra probablement du “last mile”, c’est-à-dire des usages où des experts métier intègrent l’IA dans leur travail concret

    • Si le caractère “bon” de cette bulle signifie que le matériel acheté à grande échelle est destiné à être jeté dans quelques années, je vois mal en quoi cela constitue un investissement d’infrastructure positif

    • J’aimerais qu’une bande passante mémoire fiable devienne largement disponible sur les appareils grand public. Beaucoup de fabricants de matériel négligent malheureusement cet aspect

    • Je dis souvent autour de moi : « Si vous avez une vraie idée utile pour exploiter à grande échelle des GPU bon marché, tenez-vous prêts. » Mais je n’ai toujours pas trouvé de très bonne idée de business

    • Comme pour le rail ou la bulle internet, je me demande quelle infrastructure restera et pourra être réutilisée après l’éclatement de la bulle IA

  • Je trouve que l’auteur voit les choses bien trop noir. Je suis d’accord pour dire que les entreprises d’IA brûlent énormément de cash en ce moment et que ce n’est pas soutenable, mais affirmer catégoriquement que l’IA ne pourra jamais générer de revenus me semble exagéré. Le secteur progresse à une vitesse folle et la qualité des modèles s’améliore de mois en mois. Les coûts baissent aussi rapidement. On n’a pas encore découvert toutes les façons d’utiliser l’IA Si quelqu’un conclut qu’après cette bulle, personne ne pourra utiliser l’IA pour créer de la valeur et gagner de l’argent, c’est d’une arrogance excessive

    • On dit que « les coûts baissent vite », mais les dépenses d’investissement restent énormes. Il faudra bien faire payer à la fin, non ?

    • Ce n’est pas seulement une question de rentabilité. À long terme, il faut un bénéfice net pour la société dans son ensemble Atteindre la rentabilité selon les standards actuels est facile : attirer des utilisateurs, les rendre dépendants, augmenter les prix, imposer l’IA, etc.

    • C’est quoi, noone ? On accorde beaucoup trop de confiance à ce mot

    • Depuis gpt4, les performances des modèles de base sont pratiquement au point mort. Aujourd’hui, la vraie concurrence se joue surtout sur les outils et les intégrations, et comme l’objectif visé est l’AGI, tout produit est évalué à l’aune de sa progression vers ce but. Les modèles “dernier cri” sortent sans cesse, ce qui rend la fidélisation des utilisateurs difficile, et au fond les utilisateurs s’intéressent surtout aux performances du modèle. Je vous regarde, openai...<p>« Ils m’appelaient bubble boy... » — quelqu’un chez Deutsche Bank

  • L’analyse est très détaillée, mais j’ai l’impression que l’auteur est tellement absorbé par ses propres émotions qu’il n’en tire que des conclusions qui les justifient. Je suis d’accord sur le fait qu’il y a une bulle et que beaucoup d’entreprises vont faire faillite, mais je ne pense pas que Google ou Anthropic disparaîtront (à moins que Google ne sorte un modèle aussi performant, mais bien meilleur ou beaucoup moins cher). Claude produit un code tellement bon dans des langages riches en données comme Python ou Typescript qu’il est difficile de ne pas y consacrer plusieurs centaines de dollars par mois, voire des milliers (subventionnés par l’entreprise). En ce moment, la compétition porte sur l’obtention des agents et des modèles les plus puissants. Au final, le goulot d’étranglement sera la capacité humaine à clarifier les exigences et le contexte, puis ensuite la baisse du coût des modèles deviendra le principal levier concurrentiel. On n’en est pas encore là (même si, dès maintenant, mieux on transmet la demande et le contexte, plus on utilise les modèles de façon productive). Quand la baisse des coûts deviendra l’objectif principal, je pense que Google gagnera grâce à ses capacités matérielles

    • Claude vaut plusieurs centaines, voire milliers de dollars<p>Le coût réel de l’inférence atteint déjà des milliers de dollars, voire plus. Et rien ne permet d’affirmer avec certitude qu’un ingénieur qui coûte quelques milliers de dollars de plus par mois deviendra d’autant plus productif. Les modèles aident beaucoup sur les projets greenfield, c’est-à-dire le nouveau code, mais l’ingénierie réelle consiste surtout à itérer sur de l’existant et à le maintenir. Ce qui compte donc, c’est l’écart entre le temps passé à écrire le code d’une nouvelle fonctionnalité et le temps passé à bien rédiger des prompts pour que l’IA génère ce code. Même en supposant que cet écart soit de 10 %, gagner 10 % de temps grâce à l’IA représente 4 heures par semaine. Et ces 4 heures ne seront pas toutes consacrées au développement effectif, donc au final le gain réel de production tourne plutôt autour de 5 %. Si on raisonne ainsi, pour un utilisateur qui gagne 5 % de productivité avec un salaire annuel de 10 000 dollars, l’entreprise ne dépensera pas plus de 500 dollars par mois pour l’IA. Or, si Anthropic dépense plus de 10 k$ par semaine en coût d’inférence pour un seul utilisateur, le modèle économique ne tient pas. Il faut que les coûts baissent énormément pour que cela ait un vrai sens. Dans 10 ans, si le scénario est celui d’un ingénieur recevant un laptop avec GPU intégré pour utiliser très rapidement l’autocomplétion IA, alors l’entreprise n’aura qu’un investissement unique de 3 000 à 5 000 dollars par machine. À l’avenir, le codage assisté par IA ne sera pas dominé par des “agents”, ni par le prompt engineering. Les modèles ne s’amélioreront probablement pas énormément par rapport à aujourd’hui ; ils seront simples, standardisés, utilisables, mais pas exceptionnels. Au bout du compte, le fait que cela paraisse “banal” serait un avenir sain

    • À mes yeux, il est difficile de justifier la valorisation de ces entreprises si le marché ne dépasse pas fondamentalement celui des plugins IDE

    • Il reste à voir si Claude pourra réellement être rentable. Y aura-t-il assez de gens prêts à payer volontairement le coût réel de la subvention, surtout si celui-ci représente une part importante du salaire d’une recrue supplémentaire ?

    • Quand on voit qu’OpenAI avait à une époque une “avance écrasante” et que des concurrents l’ont rattrapée en un an, on comprend que ce genre d’écart n’est pas une muraille infranchissable. C’est un marché où l’on peut être rattrapé très vite, comme le montre le cas Anthropic dès lors que des talents clés s’en vont

  • Sommes-nous dans une bulle au point de détruire une grande partie de l’économie ? J’en suis presque certain. Mais cela ne veut pas dire que l’IA elle-même est une arnaque. Après tout, la bulle internet a éclaté, mais Internet n’a pas disparu, et presque tout ce que les dot-com promettaient s’est réalisé un jour

    • Le fait qu’Internet ait fini par tout permettre ne signifie pas automatiquement que les LLM accélérés par GPU remplaceront la majorité du travail humain

    • Même le texte principal admet qu’il existe des cas où de vrais utilisateurs trouvent cela utile. Dire que c’est une “arnaque” signifie surtout que le VC, les médias et les investissements ont énormément exagéré la réalité utile. Appeler cela une bulle ne veut pas dire que tout va totalement disparaître pour ne jamais revenir, mais plutôt que la réalité finira par apparaître, qu’un grand nombre d’entreprises feront faillite, que les valorisations s’effondreront et qu’il y aura des effets en chaîne

    • Le problème avec les prédictions, c’est que le “moment” en soi constitue déjà la prédiction essentielle. On ne sait pas ce qui va arriver. Quand j’ai vu GPT-3 pour la première fois, j’ai trouvé ça franchement médiocre et je n’y ai pas prêté attention. Du coup, aujourd’hui, l’incertitude sur l’avenir me paraît bien plus grande<p>Internet aussi est un cas où “une certaine version de la promesse initiale” s’est concrétisée très longtemps après, grâce à des technologies nouvelles qui n’existaient pas à l’époque. Dire “la direction était la bonne” revient pratiquement à dire “c’était faux”

    • L’idée que presque tout ce que les dot-com promettaient s’est réalisé… et la bulle blockchain alors ? On utilise beaucoup la blockchain aujourd’hui ? Est-ce que cela a réellement changé quoi que ce soit ?

  • La bulle finira par éclater. La bulle du web a éclaté elle aussi, et le processus fera mal. Mais la technologie IA restera et entraînera de vraies transformations. Comme le web l’a fait, elle influencera les choses à la fois en bien et en mal

    • Ce qui me fait toujours rire, c’est à quel point les débats sur l’IA finissent par être pratiquement “indiscernables” des débats sur la crypto<p>(sauf que les LLM ont, eux, une utilité réelle)

    • Pendant la bulle internet, le ratio P/E du Nasdaq dépassait 200, alors qu’aujourd’hui le marché global est à 40 et Nvidia à 49. Tout le monde veut dire que c’est encore une bulle, mais si l’on regarde les vrais “clients” et les “revenus”, ce n’en est pas une du tout. ChatGPT a atteint 100 millions de MAU plus vite que n’importe quel produit de l’histoire, et serait déjà dans le top 5 des sites les plus visités du web. Cursor a dépassé les 500 millions de dollars de chiffre d’affaires plus vite que quiconque. Midjourney ne fait plus autant parler de lui, mais génère plus de 200 millions de dollars de revenus annuels et reste rentable. Honnêtement, ce sont les gens de Hacker News qui ont une vision plus “bulle” que le marché. Bien sûr, il existe aussi des entreprises surévaluées et il y aura des hauts et des bas, mais face à de tels indicateurs réels, je ne comprends absolument pas comment on peut dire que “c’est pareil que la crypto”. Selon une enquête récente, 48 % des gens ont déjà utilisé ChatGPT pour du soutien psychologique (lien vers l’enquête). Une diffusion aussi explosive est sans précédent dans l’histoire humaine. À présent, même les serveurs ne suivent plus la demande, au point que les services tombent en panne chaque semaine. C’est fondamentalement différent d’une bulle

  • L’idée défendue dans le texte est pertinente, mais elle serait plus forte et plus percutante si on supprimait un peu de graisse

  • Ironiquement, j’avais demandé à ChatGPT de me faire un résumé en français. Mais la bulle IA me fatigue tellement, et j’en ai assez de voir la moitié de ma timeline Twitter recouverte d’actualités et de threads sur l’IA

    • Reddit et LinkedIn sont devenus des foyers de contenu généré automatiquement. Cela dit, une fois qu’on connaît les motifs, c’est assez facile à filtrer et à bloquer

    • Pour les usages de résumé et de traduction, l’IA est plutôt utile<p>Je classe les résultats de l’IA selon le rapport entre la quantité d’information du prompt + des entrées et celle de la sortie<p>Résumé : sortie < entrée. Pour ce genre de tâches à faible risque, c’est correct<p>Traduction : sortie ≈ entrée (seuls le format/la langue changent). Cela demande un peu plus de vérification<p>Extension générative : sortie > entrée. C’est là que se trouve le risque. Par exemple, si on demande la composition d’un cheeseburger, l’IA va avoir tendance à “ajouter” un pain au sésame, parce qu’elle infère simplement une moyenne à partir de ses données internes. Ça peut aller, mais si quelqu’un est allergique au sésame, cela peut être grave. Il faut toujours se méfier de ce qui dépasse l’entrée. Par nature, tout résultat généré au-delà de l’entrée ne peut être qu’une sorte de “moyenne”. C’est pour cela que les productions de l’IA donnent souvent une impression de bouillie “moyenne”

  • Ce texte me paraît rafraîchissant. Je suis plutôt du côté des “optimistes”, mais j’ai l’impression qu’il manque de scepticisme dans l’ensemble. Contrairement aux tendances précédentes, dans l’industrie de l’IA il y a vraiment beaucoup d’escrocs, et il suffit d’ajouter une simple surcouche ou un chatbot pour emballer n’importe quoi comme étant “basé sur l’IA”