Je pense qu’Anthropic et OpenAI ont trouvé leur adéquation produit-marché

(simonwillison.net)

9 points par GN⁺ 2026-05-28 | 1 commentaires | Partager sur WhatsApp

Les agents de codage et agents généralistes d’Anthropic et OpenAI montrent un potentiel de revenus plus important via une facturation à l’usage en entreprise que via des abonnements grand public
Les gros utilisateurs de Claude Code et Codex consomment, avec un abonnement à 200 $/mois, l’équivalent de 2 180,16 $ de tokens au tarif API, alors que les clients entreprise sont exclus de remises comparables
En avril 2026, les deux entreprises ont aligné le coût Enterprise de Codex et de Claude Code/Cowork sur les prix publics de l’API, tout en lançant aussi des modèles frontier plus chers
Parmi 703 offres d’emploi chez OpenAI, 229, et parmi 390 chez Anthropic, 105, relèvent de la vente et du support entreprise, signe clair d’un basculement vers la vente directe
Les controverses sur les coûts chez Uber et Microsoft peuvent s’interpréter non comme des échecs de l’IA, mais comme un signal de niveau de prix acceptable : les clients trouvent cela coûteux, mais continuent d’utiliser ces produits

Les clients entreprise commencent à payer le prix API

Le plan Max à 100 $/mois d’Anthropic et le plan Pro à 100 $/mois d’OpenAI sont très avantageux pour les gros utilisateurs d’agents de codage
Si l’on convertit l’usage des 30 derniers jours en prix de tokens API avec ccusage, Anthropic Claude Code représente 1 199,79 $ et OpenAI Codex 980,37 $
- Au total, cela revient à utiliser 2 180,16 $ de tokens pour 200 $
- Même en prenant comme référence un « utilisateur qui s’en sert vraiment beaucoup » plutôt qu’un niveau où l’agent tourne toute la journée, l’écart reste important
L’hypothèse selon laquelle les entreprises obtiendraient une remise similaire en utilisant massivement ces agents s’est révélée fausse
Anthropic semble avoir modifié au cours des six derniers mois son plan Enterprise, passant d’un modèle incluant « assez d’usage pour une journée de travail typique » à une structure 20 $/mois par siège + facturation API à l’usage
- En août 2025, l’entreprise indiquait encore « Claude seats include enough usage for a typical workday »
- L’article de The Information date du 14 avril 2026, mais un porte-parole d’Anthropic affirme que le changement de prix a eu lieu en novembre 2025
- Les clients existants découvrent ce changement au moment du renouvellement de leur contrat
OpenAI a appliqué un changement tarifaire similaire en avril 2026
- D’après la grille tarifaire de Codex, à partir du 2 avril 2026, Codex n’est plus facturé par message mais selon l’usage de tokens API
- Le changement du 2 avril s’applique aux nouveaux et anciens plans Plus, Pro, ChatGPT Business, ainsi qu’aux nouveaux plans ChatGPT Enterprise
- Le 23 avril, il s’est aussi appliqué à tous les plans ChatGPT Enterprise existants, y compris Edu, Health, Gov et ChatGPT for Teachers
- Les prix sont affichés en « crédits », mais semblent correspondre au coût des tokens API selon les modèles
En avril 2026, le coût Enterprise d’OpenAI Codex et d’Anthropic Claude Code/Cowork devient identique au prix public de l’API
Le même mois, les deux leaders des modèles frontier ont aussi lancé des modèles plus chers
- GPT-5.5, lancé le 23 avril, coûte deux fois plus en API que GPT-5.4
- Opus 4.7, lancé le 16 avril, est environ 1,4 fois plus cher qu’Opus 4.6 si l’on tient compte du nouveau tokenizer
Avril 2026 marque donc à la fois la sortie de modèles frontier plus onéreux et l’abandon des fortes remises entreprise au profit d’une tarification alignée sur l’API

Le sentiment d’avoir atteint l’adéquation produit-marché

La brusque offensive tarifaire d’Anthropic et d’OpenAI peut être liée à une préparation d’IPO, mais le facteur le plus important semble être que des produits d’agents de codage et agents généralistes comme Claude Code/Cowork et Codex ont trouvé leur adéquation produit-marché
ChatGPT a connu une immense popularité, mais cette popularité était difficile à convertir en revenus
- En février, OpenAI a indiqué que ChatGPT comptait plus de 900 millions d’utilisateurs actifs hebdomadaires
- Les abonnés payants grand public étaient 50 millions, soit 5,6 % du total
Facturer 10 à 20 $ par utilisateur et par mois peut constituer une activité correcte, mais pour absorber le coût d’une infrastructure à 1 000 milliards de dollars, il faudrait conserver 1 à 2 milliards d’abonnés pendant quatre ans
Un modèle où les entreprises dépensent plus de 200 $ par utilisateur et par mois peut générer des revenus massifs beaucoup plus vite
- Pour les power users, l’usage correspond déjà à environ 1 000 $/mois de coûts API par fournisseur
Les agents de codage consomment beaucoup plus de tokens, mais deviennent aussi des outils du quotidien pour des professions qualifiées à hauts salaires
- Aujourd’hui, ils concernent surtout les ingénieurs logiciels
- Ils peuvent toutefois s’étendre à un public plus large de travailleurs du savoir qualifiés, puisqu’ils automatisent des tâches qu’on peut accomplir en donnant des instructions à un ordinateur
Les modèles lancés en novembre 2025 ont rendu les agents réellement utiles en pratique, et au cours des six mois suivants, les entreprises se sont adaptées à cette technologie, ce qui a commencé à se traduire par des dépenses réelles
On peut considérer que ChatGPT avait atteint l’adéquation produit-marché dès février 2023 en devenant l’application grand public à la croissance la plus rapide de l’histoire, mais il ne générait pas encore de revenus vraiment significatifs à l’époque
La combinaison entre agents de codage et politique tarifaire entreprise semble marquer le moment où ces entreprises commencent à générer des revenus très concrets

Le renforcement des recrutements révèle une priorité entreprise

Les offres d’emploi publiées par OpenAI et Anthropic donnent elles aussi un signal selon lequel les agents destinés aux entreprises ont atteint l’adéquation produit-marché
OpenAI affiche actuellement 703 offres d’emploi, dont 229, soit 32,6 %, sont classables dans la vente et le support entreprise
- Cela inclut notamment les account executives, le « Go To Market » et les « Forward Deployed Engineers »
Anthropic affiche 390 offres d’emploi, dont 105, soit 26,9 %, semblent relever d’une logique entreprise
Il y a une forme d’ironie à voir des laboratoires d’IA adopter un modèle de vente entreprise qui demande beaucoup de travail humain
- Les contrats enterprise nécessitent l’intervention de nombreuses personnes pour être conclus
L’analyse des recrutements a été réalisée en scrapant les sites d’offres via Claude Code, puis en passant par l’API JSON de Datasette, Datasette Cloud et Datasette Agent, avec des résultats publiés dans ce gist

Les polémiques sur les coûts, présentées comme des échecs de l’IA, reposent sur des bases fragiles

On voit se multiplier les récits selon lesquels de grands groupes tirent la sonnette d’alarme à cause de l’explosion des coûts d’usage de l’IA, mais les cas les plus cités semblent exagérés
Le cas Uber
- Le cas le plus discuté est l’article de The Information selon lequel le CTO d’Uber, Praveen Neppalli Naga, a déclaré qu’Uber avait « consommé en quelques mois tout son budget annuel IA pour 2026 »
- Une grande partie de cette hausse de coûts serait attribuée à Claude Code
- Comme Claude Code n’est vraiment devenu très performant qu’en novembre 2025, il n’est pas surprenant qu’un budget établi en 2025 n’ait pas correctement anticipé la demande de 2026
- Les propos d’Andrew Macdonald, COO d’Uber, dans le podcast Rapid Response ont aussi nourri la polémique, mais le passage concerné reste limité
- Andrew Macdonald explique que 25 % des commits de code du trimestre précédent ont été réalisés via Claude Code, mais qu’il est difficile de relier ce gain de productivité au fait d’avoir relancé des projets abandonnés ou produit 25 % de fonctionnalités utiles en plus pour les consommateurs
- Ces propos ont conduit à des titres comme celui de Business Insider, « AI tokenmaxxing spending harder to justify »
Le cas Microsoft
- Autre exemple très relayé : Microsoft commencerait à supprimer les licences Claude Code
- En apparence, il s’agit d’inciter les ingénieurs à utiliser directement l’agent maison Copilot CLI
- Tom Warren, de The Verge, cite des sources selon lesquelles cette décision a aussi une dimension financière, liée à la clôture de l’exercice fiscal de Microsoft au 30 juin
- Ces deux cas peuvent être interprétés non comme des échecs de l’IA, mais comme des signaux d’un prix acceptable : le produit paraît cher aux clients, mais ils finissent malgré tout par le choisir
- Cela rejoint l’idée qu’un bon prix est un prix qui fait d’abord retenir son souffle au client avant qu’il dise « oui »
- Le dépassement de budget chez Uber et la suppression de sièges chez Microsoft semblent illustrer cet effet dans le monde réel

Les laboratoires d’IA ont eux aussi des dépenses énormes

Les grands laboratoires d’IA dépensent des milliards de dollars à la fois pour l’entraînement et pour l’inférence
Les chiffres précis et fiables sont rares, mais un récent S-1 de SpaceX contient un indice majeur concernant Anthropic
SpaceX indique avoir conclu en mai 2026 des Cloud Services Agreements avec Anthropic PBC afin de lui fournir un accès à la capacité de calcul de COLOSSUS et COLOSSUS II
- Anthropic a accepté de verser à SpaceX 1,25 milliard de dollars par mois jusqu’en mai 2029
Dans son annonce, Anthropic explique que cet accord permettra « d’augmenter les limites d’usage de Claude Code et de l’API Claude »
- Cela suggère fortement que Colossus est utilisé non pour l’entraînement des modèles, mais pour l’inférence
Anthropic a déjà sécurisé d’énormes capacités de calcul auprès d’autres fournisseurs
- Le simple fait de vouloir dépenser 1,25 milliard de dollars par mois pour de la capacité additionnelle chez un seul fournisseur montre à quel point le budget d’inférence a explosé

L’importance relative des revenus API diminue

Au cours des deux dernières années, OpenAI semble avoir tiré une plus grande part de ses revenus des abonnements, tandis qu’Anthropic dépendait davantage des revenus API
Les revenus API d’Anthropic ont historiquement reposé en grande partie sur un petit nombre de très gros clients
- Selon un article de VentureBeat d’août 2025, Cursor et GitHub Copilot représentaient à eux seuls 1,2 milliard de dollars sur les 4 milliards de revenus de l’époque
On entend maintenant dire qu’Anthropic pourrait atteindre 10,9 milliards de dollars de revenus au deuxième trimestre et dégager un bénéfice d’exploitation pour la première fois
Le basculement vers l’entreprise suggère que les laboratoires estiment qu’il y a plus d’argent à gagner en réduisant les intermédiaires et en vendant directement aux clients
Claude Code d’Anthropic est en concurrence directe avec Cursor et Copilot
- Dans ce contexte, il est logique que Cursor investisse dans ses propres modèles

Avril 2026, un nouveau point d’inflexion

Novembre 2025 peut être vu comme un November inflection point : c’est le moment où GPT-5.1 et Opus 4.5, combinés à leurs harness d’agents de codage respectifs, sont devenus réellement utilisables
Au cours des six mois suivants, les entreprises se sont adaptées à des systèmes d’agents capables d’effectuer de manière fiable des tâches réellement utiles
Avril 2026 semble être un nouveau point d’inflexion où l’effet sur les revenus de ce changement technologique commence à se matérialiser sérieusement
- Dans un sens favorable à la rentabilité des laboratoires d’IA frontier
- Et avec un impact concret sur les budgets des grandes entreprises
Lorsque les documents S-1 d’Anthropic et d’OpenAI en vue de leurs IPO seront publiés, on pourra vérifier la réalité de ce moment à travers des chiffres audités

1 commentaires

GN⁺ 2026-05-28

Commentaires sur Hacker News

Il faudra récupérer 5 à 10 billions de dollars dans les 5 prochaines années, sinon ils commenceront à amortir les extensions matérielles
Cela implique qu’il faudrait plus de 1 billion de dollars par an en dépenses de tokens. Si l’on prend comme base 200 millions de travailleurs du savoir dans le monde et 30 millions de développeurs, cela voudrait dire un monde où 5 % des salaires de tous les travailleurs du savoir, ou 20 % de ceux des développeurs, partiraient en tokens
Autour de moi, on dit que ce type d’outils accélère réellement de 20 à 40 % sur des tâches dont les entreprises se soucient vraiment. Si une hausse de dépenses de 20 % n’apporte qu’un gain de vitesse de 20 %, il est difficile de justifier 1 billion de dollars de dépenses annuelles
On n’en est pas encore là. Pour l’instant, on est dans la phase montante du cycle de hype, et si cela ne rend pas les développeurs 2x, 5x ou 10x plus productifs sur des choses importantes, ça risque de mal finir
- J’ai quelques réflexions. En se basant uniquement sur les informations publiques, la relation entre le coût de l’inférence et le coût de l’entraînement semble contradictoire
  Les ingénieurs électriciens impliqués dans les data centers parlent des pics de consommation pendant les runs d’entraînement comme d’un facteur majeur de conception, mais les articles qui traitent du scaling au coût optimal présentent avec assurance la quantité de calcul en inférence comme un facteur majeur
  Un argument en faveur de l’idée que l’entraînement reste bien plus intensif en calcul que l’inférence, même après amortissement, est que les fournisseurs chinois, très contraints dans leur accès aux ressources de calcul, proposent des tokens presque illimités à des prix plus bas, mais avec des performances de modèle inférieures. Cela se tient si l’on interprète la situation comme des entreprises américaines qui gonflent les coûts d’inférence de 20 à 30 fois à cause de coûts d’entraînement amortis que les acteurs étrangers n’ont pas supportés
  Si le coût de l’entraînement est bien supérieur à celui de l’inférence, alors ils sont dans un dilemme du prisonnier bien plus sévère qu’un modèle concurrentiel classique à coût marginal nul. À l’inverse, si le coût de l’inférence est plus élevé, l’analyse selon laquelle c’est une activité de type utility, comme certains le disent, pourrait être correcte. Les CEO ont tout intérêt à le présenter ainsi. Si l’alternative — un dilemme du prisonnier — devenait visible, l’investissement pourrait s’arrêter très vite
  Ce qui se rapproche le plus des faits, ce ne sont que les rumeurs des ingénieurs d’infrastructure ; le reste ressemble davantage à de l’analyse de haut niveau et à du pilotage de tableur sur une activité opaque. Cela montre le niveau actuel de compréhension
  Si l’on ne connaît même pas la part respective entre capex amorti et coûts d’exploitation, toute analyse d’investisseur externe est impossible. On peut détailler autant qu’on veut la comptabilité des plantes de bureau et des plantes d’intérieur, si la plus grosse partie de l’activité est masquée par le secret commercial, cela n’a aucun sens
- Je travaille dans une toute petite entreprise qui fait 150 millions de dollars de chiffre d’affaires annuel avec une marge nette de 9 %, et nous envisageons déjà de dépenser 100 000 dollars en matériel pour faire tourner des modèles locaux, parce que c’est largement suffisant pour nous
  Les dépenses prévues en AI-as-a-service dépasseront ce coût en moins d’un an
  J’ai l’impression que, dans quelques années, même de très petites entreprises pourront acheter à un prix abordable du matériel capable de faire tourner, pour la plupart des usages, des modèles de pointe suffisamment bons
- Chacun observe des choses différentes, mais ce que je vois n’est pas très différent non plus. Simplement, c’est une vue de bas en haut. À ce stade, ne devrait-on pas aussi voir quelque chose de haut en bas ?
  Si l’on a dépassé le stade du potentiel pour entrer dans celui de gains de productivité significatifs, pourquoi cela n’apparaît-il pas dans les chiffres côté clients ?
  Pourquoi Delta Airlines n’a-t-elle pas fortement amélioré son efficacité opérationnelle au cours des 3 derniers mois grâce à l’adoption de meilleurs logiciels ?
  C’est une vraie question. Je vois une rupture
- Je me souviens très nettement de ce qu’un professeur d’économétrie disait quand j’étais étudiant à la fin des années 1990 et au début des années 2000
  Quand la télévision par câble et le Pay Per View sont arrivés, il y a eu des études sur le nombre de films que les gens regarderaient s’ils avaient un accès illimité, et les résultats circulaient comme si c’était la preuve qu’il fallait déployer toute l’infrastructure pour soutenir cette activité. Puis des statisticiens ont analysé les données de plus près et ont conclu que les gens avaient répondu qu’ils regarderaient des films tous les jours, 7 jours sur 7, 10 à 12 heures par jour. C’étaient des chiffres impossibles
  J’ai l’impression qu’on est aujourd’hui dans un bateau similaire. Certains supposent que tout le monde utilisera le maximum de tokens, et que malgré les améliorations du matériel, du logiciel, de la conception et des pressions de marché, le prix des tokens ne baissera jamais
- Un facteur à prendre en compte est que, dans les 5 prochaines années, la population de référence ne restera pas la même
  Chaque génération d’outils pour développeurs a augmenté le débit absolu de code tout en créant de nouvelles couches de développeurs et d’utilisateurs
  C’est toujours ce qui s’est passé, du premier compilateur à l’ère des frameworks jusqu’à aujourd’hui, et le niveau de compétence requis pour devenir développeur a baissé. À la fin des années 1980, il fallait des informaticiens de niveau master ou doctorat pour écrire des applications, puis on est descendu vers les étudiants de licence et les ingénieurs IT ; la théorie informatique est devenue largement optionnelle ; puis encore vers des diplômés avec un peu de formation ; puis, avant 2022, via des outils no-code/low-code comme retool ; et maintenant encore plus bas avec des services de génération de code agentique comme v0/Replit
  La prochaine génération de développeurs ne construira pas des applications et des architectures comme la précédente. Ici, la plupart d’entre nous ne construirions pas non plus à un niveau de qualité comparable à celui de pg lorsqu’il a créé cette plateforme, mais ce n’est pas grave tant que les utilisateurs y trouvent de la valeur. D’innombrables applications d’entreprise de qualité moyenne le prouvent déjà
  Au final, la logique de ces activités est précisément que les chiffres 200 millions / 30 millions ne resteront pas fixes. Je pense moi aussi que ce changement ne sera probablement ni assez grand ni assez rapide pour justifier ces capex. Mais les révolutions Web 1, Web 2.0, SaaS et mobile ont aussi créé assez vite de nouvelles couches d’utilisateurs et de développeurs, donc ce n’est pas totalement irréaliste
  [1] HN est une forte exception avec son implémentation Lisp sur mesure, mais à l’époque précédente, il y avait beaucoup d’exemples d’architectures plus classiques mais solides, et ce niveau de compétence est peut-être difficile à trouver chez la génération actuelle de fondateurs
Cette analyse est confuse. Du côté du code, l’adéquation produit-marché (PMF) a probablement déjà été atteinte l’an dernier. La rentabilité est une question distincte, et on n’en sait encore rien
Le texte mélange les deux sans pour autant présenter d’argument économique solide ni de chiffres convaincants. Je ne vois même pas pourquoi le cas d’Uber est pertinent. Le COO d’Uber a lui-même clairement dit qu’au moins du point de vue du retour sur investissement, les résultats n’étaient pas au rendez-vous
À mon avis, le produit était déjà très utile pour le code il y a quelques mois. Mais il n’est certainement pas utile à n’importe quel coût
- Ce qui est déroutant, c’est que les gens semblent ignorer la trajectoire. C’est peut-être la partie la plus importante, et pourtant elle est enterrée
  Comme l’a dit Simon, cela fait seulement 6 mois que des agents de code « suffisamment bons » existent, et c’est un clin d’œil à l’échelle du temps. Pourtant, dans notre entreprise, mon travail a complètement changé et c’est presque irréel
  Et ce n’est qu’un point d’inflexion. Il y en a déjà eu plusieurs, et d’autres arrivent. Je peux entendre l’argument selon lequel, aujourd’hui même, avec des dépenses d’entreprise absurdes, le retour sur investissement n’est peut-être pas positif, mais préparer le terrain dès maintenant pour ce qui arrive dans quelques mois, et plus encore dans quelques années, est tout à fait rationnel
- Le PMF est un concept défini de façon étrange, comme si « si on n’est pas sûr qu’il existe, alors il n’existe pas »
  Pour ceux qui ont pris le temps de l’utiliser et de le comprendre, c’était clairement utile depuis plusieurs mois, mais ce savoir s’est maintenant diffusé jusqu’aux personnes qui tiennent le budget, qui sont désormais convaincues qu’il ne s’agit ni d’une mode passagère ni de simple hype, et cela semble permettre de « revendiquer » le PMF
  Cela dit, je suis d’accord pour dire que c’est étrange de dire « ces gens-là ont le PMF ». En général, c’est un concept qu’on définit pour son propre produit
- Oui. Le coût fait aussi partie de l’équation économique
  C’est pourquoi beaucoup de gens ici feraient mieux de ne pas entrer dans la discussion. Ils ne font que répéter les avantages sans identifier ni expliquer les coûts, ni l’impact de ces coûts sur la santé financière de l’entreprise
- Le texte fait reposer beaucoup trop de choses sur le mot « bon », ce qui me rend sceptique quant à l’analyse
  « Si nous appelons novembre 2025 le point d’inflexion de novembre, c’est parce que GPT-5.1 et Opus 4.5, combinés chacun à leur propre harnais d’agent de code, se sont améliorés. Ils sont devenus assez bons pour accomplir de façon fiable un travail utile, et nous nous adaptons donc depuis 6 mois à des systèmes d’agents »
- Ce n’est pas censé être un texte logique. C’est plus proche d’un blog de prosélytisme LLM, et on y trouve très peu d’analyse critique défavorable au secteur
  Même en lisant d’autres textes, on voit très peu de scepticisme, surtout de la promo sur à quel point c’est formidable
Ce texte a un petit côté psychose de l’IA
« Ces outils brûlent bien plus de tokens, mais deviennent rapidement des outils quotidiens pour le travail effectué par des experts très bien rémunérés »
« Je ne sais pas comment ce passage s’est transformé en titres du genre “Le COO d’Uber a dit qu’il devenait plus difficile de justifier les dépenses excessives en tokens d’IA”, parce que le marché des récits d’échec de l’IA reste immense »
Oui, bien sûr, ce n’est qu’un désir de voir l’IA échouer. Il ne peut pas s’agir de dérapages de coûts, de revenus records ou de licenciements massifs. Et il est évidemment impossible que des personnes déjà très bien payées soient en train de brûler de l’argent avec ces outils sans créer la moindre augmentation de « valeur ». Je reconnais que la production est 100 fois supérieure, mais que les résultats restent plats sur tous les indicateurs
[1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
[2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...
- Qu’est-ce que tu entends exactement par psychose ?
Si GLM-5.1 est presque aussi bon, open source et bien moins cher, comment OpenAI et Anthropic comptent-ils fidéliser leurs clients ?
Leur modèle économique ne semble pas pouvoir fonctionner. Un ami très proche travaille réellement sur des logiciels d’automatisation pour grandes entreprises, et n’utilise ni Claude ni OpenAI
Il utilise surtout gpt 120b et GLM-5.1 sur Cerebras pour les tâches de raisonnement lourdes, et d’autres petits modèles pour diverses tâches. Tout est open source
Ces systèmes sont très utiles pour les entreprises, et permettent de faire tourner des pipelines entièrement automatisés, très stables et rapides
On parle souvent de ce sujet, et tous les deux on pense que les entreprises qui font des tâches d’agents lourdes avec Claude et OpenAI ne mesurent pas vraiment à quel point l’open source s’est amélioré et est devenu moins cher au cours de l’année écoulée
Donc si les entreprises et les développeurs en place finissent par rattraper leur retard, est-ce que Claude et OpenAI ne risquent pas de ne jamais récupérer leurs coûts ?
- GLM-5.1 n’est pas au même niveau. Il ne fait pas le poids face à Opus de Claude Code. Il suffit de l’essayer. Les modèles open source ont au moins 1 an de retard
- Je suis d’accord sur le fait qu’on ne voit pas le modèle économique. Du point de vue des 5 forces de Porter, c’est un cauchemar
  Un très grand nombre d’entreprises vont se faire concurrence dans cet espace, et même si le caractère capitalistique crée une certaine forme de moat, il y aura malgré tout en pratique un nombre quasi infini de concurrents
  C’est bien pour les consommateurs
- Pour le code, il faut toujours utiliser le meilleur modèle du domaine à l’instant T, pas un modèle qui aurait été le meilleur il y a 1 an. C’est exactement la position de GLM 5.1
  Je dis ça en grand fan de GLM pour les sites de traduction, car son rapport qualité-prix est suffisant
  En ce moment, l’essentiel de l’argent est dans le code. Si OpenAI et Anthropic n’ont que 6 mois d’avance sur les meilleurs modèles open source de pointe, ils peuvent prendre la majeure partie du marché des entreprises et des développeurs
- J’ai essayé plusieurs grands modèles open via OpenRouter dans OpenCode pour l’assistance au code, et ils étaient tous assez médiocres par rapport à Claude Opus
  Tu pourrais donner quelques pistes sur la manière de mieux tirer de la valeur des modèles open ?
  Je suis d’accord avec l’idée courante selon laquelle les modèles open ont environ 1 an de retard. Mais il y a environ 1 an, il s’est produit quelque chose de presque magique qui a rendu les modèles de pointe extrêmement utiles. Avec cette logique, les modèles open devraient bientôt aussi bien fonctionner, mais j’ai peur qu’il y ait autre chose en jeu que le simple fait d’attendre une révolution supplémentaire de la Terre
  Pour préciser, mon usage est l’assistance au code. Pour d’autres usages, les modèles open peuvent être excellents
- Pour faire tourner ces modèles “aussi bons que les modèles de frontière”, ne faut-il pas dépenser 5 000 à 10 000 dollars ?
  Je n’ai jamais vu d’analyse convaincante du retour sur investissement pour faire tourner soi-même un modèle de code, surtout comparé à des forfaits à 20 ou 200 dollars par mois
L’expression « 200 dollars pour 2 180,16 dollars de tokens » est étrange
Les tokens n’ont pas de coût ni de valeur intrinsèques. Dire qu’on a utilisé 2 180,16 dollars de tokens, c’est un peu comme croire un commercial qui essaie de vous convaincre qu’une batterie de casseroles à 19,99 dollars vaut 1 milliard de dollars
C’est assez drôle de voir la pensée critique passer par la fenêtre dès qu’il s’agit d’évaluer une source biaisée
- Je ne vois pas très bien ce que tu contestes ici
  J’ai dépensé 200 dollars. Si j’avais payé au tarif API, cela aurait coûté 2 180,16 dollars. Le billet explique que les clients entreprises paient le tarif API, donc si j’avais été employé dans une telle entreprise, j’aurais généré 2 180,16 dollars de coût pour elle
  Qu’est-ce que j’ai raté ?
- Les tokens ont bien un coût intrinsèque calculable. Il y a le coût marginal de production, c’est-à-dire le coût d’inférence, ainsi que les coûts de R&D amortis du modèle qui produit ces tokens
  Il est difficile d’en calculer la valeur, mais heureusement, le mécanisme de prix du marché existe précisément pour ça. Il n’y a pas de meilleur chiffre que le prix que les gens sont prêts à payer
  Donc oui, avec un plan entreprise, cela revient à dépenser 2 180,16 dollars. La personne concernée ne paie pas ce montant, mais l’entreprise, oui
- D’après un calcul approximatif sur mon projet, payer au token sur OpenRouter est compétitif, et parfois même moins cher, que de faire tourner le même modèle à poids ouverts sur des GPU loués
  Le prix par token se situe dans une fourchette similaire pour les modèles de frontière fermés comme pour les modèles à poids ouverts, c’est-à-dire de l’ordre de quelques centimes à quelques dollars par million de tokens. Pour moi, cela indique que ces prix ont un certain ancrage dans la réalité
- Avec un minimum d’esprit critique, cette phrase se lit comme « 2 180 dollars de tokens aux tarifs API actuels »
- Bien sûr qu’il y a un coût intrinsèque. Le plancher, c’est la facture d’électricité. C’est vraiment drôle de voir la pensée critique être abandonnée quand il s’agit d’évaluer une source biaisée
Le vrai timing tient au fait qu’il manque aujourd’hui une forte demande de nouvelles activités, et que, comme on a accumulé suffisamment d’actifs techniques, le travail devient de plus en plus incrémental
Cela signifie qu’on peut empiler des fonctionnalités stables sur une énorme base de travail passée, et c’est précisément là que l’IA brille. Donc, avec ou sans IA, si la majeure partie du travail consiste à ajouter une fonctionnalité, corriger un bug ou ajuster un peu une configuration, les entreprises auraient de toute façon moins embauché d’ingénieurs logiciel. L’IA n’a fait qu’accélérer cette pression
À l’inverse, si on imagine la même IA il y a 20 ans, c’est différent. Quand les gens essayaient encore de comprendre JAX-RS, est-ce que l’IA aurait vraiment pu utiliser Jersey ? Quand React venait juste d’être inventé, aurait-elle pu répondre à toutes les questions sur React ? Aurait-elle pu réduire d’un facteur 10 les effectifs nécessaires pour construire toute l’infrastructure de cloud public ou les soi-disant plateformes big data ? À l’époque, tout évoluait si vite qu’il fallait beaucoup d’ingénieurs pour explorer d’innombrables possibilités. Je doute aussi fortement qu’on aurait pu bâtir l’écosystème du machine learning avec un dixième des effectifs grâce à l’IA. Il y a 20 ans, c’était R qui dominait, et l’écosystème Python n’était pas du tout mûr. Même chose pour le mobile : est-ce que l’IA aurait réduit à un dixième le nombre de personnes nécessaires pour créer toutes les apps mobiles et l’infrastructure sous-jacente ?
- À la question « est-ce que l’IA aurait pu répondre à toutes les questions sur React ? », je pense que oui grâce à l’apprentissage en contexte (ICL)
  À « aurait-elle pu construire l’infrastructure de cloud public ou les plateformes big data avec un dixième des effectifs ? », je pense que non. Elle ne résout pas les problèmes fondamentaux, et à grande échelle elle devient vite ingérable
  Sur le travail incrémental, je suis d’accord. Cela dit, historiquement, la plupart des emplois ont toujours été incrémentaux, et les postes de R&D ont toujours été minoritaires
Il faut reconnaître ce qui doit l’être. Tout cela est la plus grande arnaque de l’histoire.
L’IA a des cas d’usage utiles, mais pas aux prix actuels. J’utilise l’IA avec pas mal de gros utilisateurs depuis l’époque de GPT-2. Tous les utilisateurs racontent la même chose : curiosité, émerveillement, battage médiatique, dégoût, prise de conscience. Les entreprises arrivent généralement un peu en retard, et nous sommes en plein cycle de hype. C’est précisément à ce moment-là qu’on vend tous les contrats et qu’on fait l’IPO
Un mouvement vraiment digne d’un manuel de VC
Ce qu’il ne faut pas mal comprendre, c’est qu’il existe des usages utiles de l’IA. Simplement pas de la manière qu’ils veulent. C’est assez similaire à la blockchain. L’idée d’une monnaie décentralisée a le droit d’exister. Pas les 99 % des autres coins
L’IA est un moteur de recherche plus rapide, mais toujours moins précis. C’est excellent pour trouver des bugs et très bien aussi pour le rubber duck debugging
Si j’appelle ça une arnaque, c’est parce que, avec le marketing, on donne à énormément de gens dans le monde l’impression qu’ils peuvent désormais créer des startups, des jeux, de l’infra, etc. sans plus avoir à apprendre par eux-mêmes. Résultat : des millions de projets et de produits abandonnés, de mauvaise qualité. La plupart n’ont jamais construit les modèles mentaux nécessaires pour résoudre un problème de fond en comble. Au final, ils gaspillent des mois et de l’argent, et ne font que brûler des tokens. C’est pour ça que j’appelle ça une arnaque
Tous les early adopters que je connais ont fortement réduit leur usage, non pas à cause de l’argent, mais parce qu’il n’y a pas de nouveaux cas d’usage. Pour explorer un nouveau projet, il suffit de faire un onboarding rapide, d’apprendre beaucoup, puis de passer à la documentation et aux tests réels. Mon usage est au plus bas depuis deux ans
Je ne laisserai pas l’IA toucher à mon code. J’aurais peur qu’elle s’y réinstalle. En revanche, je la laisse lire mon code et me dire ce que j’ai mal fait afin que je puisse m’améliorer moi-même
Des centaines d’entreprises peuvent offrir ce niveau de service, y compris avec des solutions open source
Tous mes amis non techniques sont en plein dans le cycle de hype en ce moment, et me partagent l’excitation à venir ainsi que la désillusion prévisible
D’une certaine manière, il est impressionnant que l’IA ait été exploitée de façon aussi parfaitement VC, consciemment ou non, pour créer d’énormes entreprises sous les yeux du monde entier
- J’essaie de résumer ton argument initial, tu peux m’aider ?
  Tu veux dire que c’est une arnaque parce que le retour sur investissement des modèles de code qui consomment des tokens n’est pas positif ? Par exemple, qu’ils ne créent pas assez de valeur pour justifier 100 $ par mois ?
  Tu veux dire que les clients entreprises ne sont pas assez malins pour le voir ?
  Qu’au fond c’est une illusion façon blockchain, et qu’on fait une IPO pour maximiser les gains des CEO ?
  Est-ce que j’ai bien compris, ou est-ce que je te fais dire plus que tu n’as dit ?
  La partie sur le fait de « donner aux gens l’impression qu’ils peuvent désormais créer leur propre startup, jeu ou infra sans plus avoir à apprendre eux-mêmes » ne relève-t-elle pas de l’homme de paille, même si on ne peut pas trancher sur les croyances et motivations des gens ? L’IA est un outil puissant qui amplifie l’humain. On ne peut pas juste écrire un prompt comme « crée-moi une app SaaS enterprise valant 1 milliard de dollars » ou « crée-moi GTA6, sans halluciner ». Mais est-ce vraiment l’impression que cela donne ? Dario et Sam disent-ils qu’« en achetant notre abonnement à l’agent de code, vous pourrez créer un jeu d’un coup sans compétences techniques et devenir riche » ?
  On peut tout à fait ne pas voir de valeur dans les agents IA aujourd’hui. On peut aussi avoir un mauvais pressentiment. Mais dire que c’est une arnaque au même niveau que la blockchain me semble contredire d’énormes signaux, ainsi que les discussions réelles sur ce que ces systèmes peuvent faire aujourd’hui et sur ce qu’on s’attend à ce qu’ils puissent faire d’ici la fin de l’année
D’après ce que j’ai lu, Anthropic n’est pas réellement rentable et n’a semblé brièvement dans le vert qu’à cause de remises. Cet article défend bien cette thèse : https://www.wheresyoured.at/anthropics-profitability-swindle...
Je suis sceptique sur le fait que les hausses de prix actuelles soient suffisantes, et je suis sceptique aussi sur le fait que la plupart des utilisateurs et des entreprises accepteront les hausses de prix encore plus importantes qui seront nécessaires à l’avenir. En particulier, 200 $ par mois est déjà extrêmement cher pour un particulier, et je doute que la plupart paient des tarifs du type 1 000 $ par mois
Pour les actualités liées aux LLM, j’ai l’impression qu’il faut simplement les ignorer jusqu’à ce que ces entreprises aient IPO. Il y a beaucoup de bots qui fabriquent une opinion positive
200 $ par mois et par siège, ce n’est rien
Un seul package de licences 3D CAD utilisé par les gens de notre groupe R&D coûte plusieurs milliers de dollars par mois et par siège
Il est temps que les sièges logiciels soient eux aussi aimés
- AutoCAD coûte 175 $ par mois et par utilisateur [1]
  [1] https://www.autodesk.com/products/autocad/buy
- Oui, ce n’est rien, mais ce n’est pas non plus ce que les entreprises paient réellement. Comme l’indique l’article, le prix est de 20 $ par mois et par siège, plus des frais d’usage API par token
  Les entreprises ne paient pas un « buffet illimité » au forfait, mais une facturation à l’usage
- Même la licence CATIA la plus chère que j’aie vue tourne autour de 600 $ par mois et par utilisateur. D’où vient ce chiffre de « plusieurs milliers de dollars » par siège ?
- Si tu ajoutes maintenant les salaires des ingénieurs, tu te rends compte que les sièges logiciels coûtent déjà plus cher que ces sièges R&D
- Le CAD est-il censé devenir l’outil de tous ceux qui travaillent ?

Je pense qu’Anthropic et OpenAI ont trouvé leur adéquation produit-marché

Les clients entreprise commencent à payer le prix API

Le sentiment d’avoir atteint l’adéquation produit-marché

Le renforcement des recrutements révèle une priorité entreprise

Les polémiques sur les coûts, présentées comme des échecs de l’IA, reposent sur des bases fragiles

Le cas Uber

Le cas Microsoft

Les laboratoires d’IA ont eux aussi des dépenses énormes

L’importance relative des revenus API diminue

Avril 2026, un nouveau point d’inflexion

À lire aussi

1 commentaires

Commentaires sur Hacker News