Les abonnements IA sont une bombe à retardement pour l’entreprise
(thestateofbrand.com)- OpenAI, Anthropic, Google et d’autres proposent aux entreprises des abonnements à un prix inférieur au coût réel de fourniture, ce qui peut provoquer un choc budgétaire majeur lors d’un futur réajustement tarifaire
- Le forfait mensuel à 20 dollars de Claude Pro et ChatGPT Plus peut correspondre, pour les gros utilisateurs, à un coût API réel allant jusqu’à 200 à 400 dollars par siège et par mois
- L’IA agentique augmente fortement la consommation de tokens via une exécution autonome prolongée, et GitHub Copilot passera lui aussi à une facturation à l’usage en juin 2026
- Pour une équipe de 50 personnes, un abonnement mensuel de 1 000 dollars peut représenter en réalité 15 000 à 40 000 dollars par mois en coût basé sur les tokens, ce qui accroît fortement l’exposition budgétaire
- La préparation d’une IPO chez OpenAI et Anthropic renforce la pression sur les marges et l’économie unitaire, ce qui pourrait accélérer les hausses de prix, les limitations d’usage et le passage à une facturation basée sur la consommation
L’écart entre le prix des abonnements IA et leur coût réel
- OpenAI, Anthropic, Google et d’autres grands fournisseurs d’IA proposent leurs services aux entreprises à des prix d’abonnement inférieurs au coût réel de fourniture. Si les entreprises prennent ces tarifs comme une référence durable et construisent leurs flux de travail dessus, elles risquent de subir un choc budgétaire important lors d’un futur ajustement des prix
- Claude Pro propose pour 20 dollars par mois Sonnet 4.6, Opus 4.6, la recherche web, l’exécution de code, la génération de fichiers, ainsi qu’un volume d’usage environ 5 fois supérieur au niveau gratuit
- Selon la tarification API, Sonnet 4.6 coûte 3 dollars par million de tokens en entrée et 15 dollars par million de tokens en sortie, tandis qu’Opus 4.6 coûte 5 dollars par million de tokens en entrée et 25 dollars par million de tokens en sortie
- Un travailleur du savoir qui utilise Claude plusieurs heures par jour pour téléverser des documents, rédiger des rapports et faire de l’analyse de données peut consommer plusieurs millions de tokens par semaine. Converti en tarification API, cela peut monter à 200 à 400 dollars par siège et par mois
- Microsoft aurait perdu plus de 20 dollars par utilisateur et par mois sur GitHub Copilot, et le coût de calcul d’un gros utilisateur abonné à 10 dollars par mois serait monté jusqu’à 80 dollars
- Une analyse indique aussi que des utilisateurs d’Anthropic ont consommé plus de 8 dollars de calcul pour 1 dollar de revenu d’abonnement. Nick Turley, VP produit chez OpenAI, a décrit la tarification des abonnements comme une structure installée presque par hasard et a comparé la possible suppression progressive des forfaits illimités à l’électricité en usage illimité
- ChatGPT Plus est resté à 20 dollars par mois pendant trois ans, alors que ses fonctionnalités se sont enrichies entre-temps avec la génération d’images, l’interprétation de code, le mode vocal, le raisonnement agentique et la recherche web
La stratégie tarifaire commune des principaux fournisseurs
- Google regroupe Gemini Advanced dans l’offre Google One AI Premium à 20 dollars par mois, tout en facturant séparément l’accès API au même modèle
- Meta distribue Llama gratuitement et subventionne, via ses revenus publicitaires, le coût de calcul de centaines de millions de requêtes IA exécutées sur ses propres plateformes
- Le Grok de xAI a fixé un prix API d’entrée bas, à 0,20 dollar par million de tokens, dans une logique présentée comme acceptant des pertes pour gagner des parts de marché
- Le schéma commun consiste à fixer les prix en privilégiant l’adoption plutôt que la rentabilité, à verrouiller les organisations et à faire de l’IA un élément central du travail quotidien de chaque équipe, tout en repoussant à plus tard la question du coût
- OpenAI perdrait de l’argent sur les abonnés grand public et étudierait un recentrage stratégique vers l’entreprise, où l’économie unitaire serait relativement moins défavorable
- Selon le Wall Street Journal, OpenAI a manqué certains objectifs majeurs de revenus et d’utilisateurs en chemin vers une IPO, et le modèle tarifaire subventionné montre déjà des fissures
L’IA agentique aggrave la structure de coûts
- Dans l’usage chatbot, les questions-réponses généraient une consommation de tokens relativement prévisible, mais l’IA agentique augmente fortement le volume utilisé via des exécutions autonomes de longue durée
- Les sessions de Claude Code s’exécutent de manière autonome pendant de longues périodes et consomment des tokens à un rythme bien plus élevé qu’un usage conversationnel
- Certains utilisateurs disent avoir épuisé une fenêtre de limitation de débit de 5 heures en 90 minutes
- GitHub a annoncé que, le modèle forfaitaire s’étant effondré face aux charges de travail agentiques, Copilot passerait à une facturation à l’usage à partir du 1er juin 2026
- GitHub explique que Copilot a fortement évolué et que l’usage agentique « devient la norme », ce qui augmente les besoins en calcul et en inférence
- Sam Altman a déclaré publiquement qu’OpenAI devait désormais devenir une entreprise d’inférence IA, ce qui rejoint l’idée qu’un usage agentique nécessite fondamentalement un modèle économique différent
- Dans les équipes d’ingénierie, des Agent Teams où plusieurs instances IA traitent un même projet en parallèle font exploser les coûts. Si un développeur exécute en même temps 3 ou 4 agents de code, l’usage de tokens peut dépasser non pas de quelques fois, mais d’un ordre de grandeur entier celui d’une simple conversation
Une exposition aux coûts que les entreprises ne mesurent pas
- Depuis deux ans, beaucoup d’entreprises ont intégré les abonnements IA au cœur de leurs opérations : le marketing rédige avec ChatGPT Plus, l’ingénierie code et révise avec Claude Pro, et les équipes de recherche, de customer success ou de finance utilisent aussi l’IA pour résumer des documents, synthétiser des tickets ou modéliser des scénarios
- Si 50 personnes utilisent Claude Pro, le coût actuel est de 1 000 dollars par mois. Pour ChatGPT Plus, on est au même niveau, ce qui donne l’impression que l’IA n’est qu’une petite ligne dans le compte de résultat
- Mais si l’on calcule l’usage API réel de cette même équipe sur la base de la consommation de tokens, le montant peut atteindre 15 000 à 40 000 dollars par mois selon l’intensité d’usage, transformant le sujet en poste budgétaire dédié
- Quand les prix seront réajustés, les entreprises qui considéraient l’IA à 20 dollars par mois comme un intrant durablement bon marché risquent de recevoir une facture non prévue, alors même que l’outil sera déjà profondément intégré aux workflows et difficile à retirer
- Les subventions créent une dépendance, et cette dépendance devient un piège qui rend les hausses de prix difficiles à éviter
- Le Q1 2026 AI Quarterly Pulse de KPMG indique que les organisations américaines prévoient en moyenne 207 millions de dollars de dépenses IA sur les 12 prochains mois, soit presque le double sur un an
- Selon une enquête de recherche Goldman Sachs, de nombreuses grandes entreprises dépassent déjà leur budget IA de plusieurs ordres de grandeur, et les dépenses IA pourraient bientôt rivaliser avec les salaires des ingénieurs
- Swami Chandrasekaran, responsable du laboratoire IA et données de KPMG North America, a déclaré à Marketplace qu’il y a seulement un ou deux trimestres, personne ne se préoccupait vraiment du coût de consommation des LLM
- L’économiste Brian Jabarian, de l’University of Chicago, qui conseille les entreprises sur leur transformation IA, estime que le moment de la facture approche
L’IPO pourrait imposer un réajustement tarifaire
- OpenAI et Anthropic préparent une IPO, et ce processus pourrait accentuer la pression visant à réduire l’écart entre prix d’abonnement et coût réel
- Anthropic aurait dépassé les 30 milliards de dollars de revenus annualisés, en hausse par rapport à 9 milliards de dollars fin 2025
- OpenAI serait sur un rythme de revenus d’environ 25 milliards de dollars
- OpenAI prévoirait 115 milliards de dollars de consommation de trésorerie cumulée d’ici 2029 et se serait engagé sur 665 milliards de dollars de dépenses de calcul d’ici 2030
- Oracle aurait assumé 43 milliards de dollars de dette sur un seul exercice fiscal pour construire des datacenters destinés à OpenAI
- Tant qu’elles restent privées et brûlent du capital-risque, ces entreprises peuvent subventionner les coûts d’inférence, exploiter les modèles à perte et maintenir des forfaits à 20 dollars par mois dont le coût de fourniture dépasse 100 dollars
- Après l’IPO, les marchés publics demanderont des marges, les analystes exigeront une économie unitaire crédible, et les investisseurs voudront une trajectoire de rentabilité qui ne repose pas sur un financement illimité
- Les moyens les plus rapides de réduire cet écart tarifaire sont les hausses de prix, les limitations d’usage et le passage à une facturation basée sur la consommation, trois évolutions qui pourraient toutes avoir un impact important sur les abonnés entreprises actuels
Des signaux de réajustement déjà visibles
- GitHub passera à une facturation à l’usage le 1er juin 2026, en remplaçant les requêtes premium forfaitaires par des AI Credits basés sur les tokens
- Microsoft a augmenté deux fois les prix de Microsoft 365 en quatre ans, et la hausse la plus récente est directement liée au coût de l’infrastructure IA
- OpenAI a introduit un palier Pro à 100 dollars comme nouveau vrai niveau de prix pour les gros utilisateurs
- Le palier Max à 200 dollars par mois d’Anthropic illustre ce que pourrait réellement coûter un usage soutenu une fois les subventions terminées
- Geoff Webb, VP chez Conga, estime que l’ampleur de la course à la conquête du marché de l’IA est gigantesque, tout comme le coût pour la dominer, ce qui rend probables des changements rapides et majeurs dans les modèles économiques et les prix des services au moment de la monétisation et du retour sur investissement
Ce que les dirigeants d’entreprise doivent faire dès maintenant
- Les entreprises doivent auditer la consommation réelle de tokens par équipe, au lieu de se contenter de compter les sièges
- Elles doivent modéliser l’évolution du coût IA dans des scénarios à 2x, 5x et 10x par rapport aux prix actuels
- Elles doivent intégrer dans leur stack une option de choix fournisseur afin qu’un changement de prix d’un seul acteur ne fasse pas s’effondrer brutalement le budget
- Elles doivent discuter de cet écart de coût avec le CFO avant que le CFO ne soulève lui-même le problème
- L’écart entre ce que l’organisation paie aujourd’hui pour l’IA et ce qu’elle paiera dans 18 mois pourrait devenir l’une des plus fortes hausses de poste de dépense que beaucoup d’entreprises auront à absorber
- Certaines entreprises pourraient devoir expliquer pourquoi un outil qui coûtait auparavant moins cher qu’un déjeuner d’équipe exige soudain un budget annuel à six chiffres
- L’ère des subventions touche à sa fin, et beaucoup d’entreprises n’ont toujours pas commencé cette discussion
4 commentaires
On dirait le même problème qu’à l’époque des mainframes..
Si on est dans une configuration où les serveurs sont chers et les ressources limitées, tandis que les ordinateurs personnels sont lents,
au final les serveurs finiront aussi par devenir moins chers et les ordinateurs personnels gagneront en performances... J’ai l’impression que le temps apportera la réponse.
Si c'est trop cher, il suffit de ne pas l'utiliser..
On peut se dire que si, malgré les prix, les gens continueront à payer, c’est probablement pour cela que les fournisseurs de LLM augmentent leurs tarifs. Je me demande ce qu’il adviendra à l’avenir des LLM open source comme GLM, qwen ou deepseek. Les gens vont commencer à calculer s’il vaut vraiment la peine de payer ce prix pour utiliser des modèles de pointe, ou s’il ne vaut pas mieux utiliser de l’open source, quitte à faire l’effort de mettre en place sa propre infrastructure vLLM.
Réactions sur Hacker News
Tous les abonnements à l’IA sont une bombe à retardement pour les fournisseurs de modèles frontier
D’ici quelques années, on fera tourner pour presque rien des modèles locaux aussi bons que les modèles frontier actuels, et la base du marché entreprise des sociétés frontier s’effondrera
Rien qu’en regardant les besoins en mémoire, c’est énorme, et pendant encore un bon moment, il sera bien plus rentable d’utiliser du matériel d’hébergement spécialisé mutualisé avec un taux d’utilisation élevé
Ils doivent continuer à s’améliorer pour rester devant les autres et les modèles à poids ouverts, donc c’est presque l’inverse d’une bombe à retardement
Les tokens d’inférence au niveau actuel vont continuer à devenir moins chers, et je ne sais pas si le local sera l’état final vu les exigences matérielles élevées, mais la concurrence tend à pousser les marges vers zéro
Longue discussion sur ce sujet : https://corecursive.com/the-pre-training-wall-and-the-treadm...
Je surveille l’usage des tokens et j’avance activement pour réduire les coûts d’inférence et internaliser le tout, au lieu de brûler bêtement des montagnes de tokens
Mon patron était très content, et on est maintenant en train de le déployer plus largement. Pour moi, c’est ça, l’avenir
Les lois d’échelle deviennent déjà lourdes à porter, et il ne faut pas se laisser berner par l’exagération du « tout est exponentiel »
En plus, le vrai concurrent, ce sont les modèles frontier d’ici deux ans
Aujourd’hui, il faut du matériel plus gros, plus cher et plus énergivore qu’il y a 1 ou 2 ans
Le ton excessif des textes des deux camps de l’IA est épuisant
J’aimerais me mettre devant un tableau blanc avec quelqu’un qui comprend vraiment l’économie et le business des fournisseurs de tokens, et lui poser des questions « comme si j’avais cinq ans »
Est-ce un jeu de marges pour les fournisseurs de tokens et un jeu de qualité de service/produit pour les consommateurs ? Si la courbe de la qualité et celle de la marge finissent par se croiser, est-ce une course pour atteindre ce point avant de manquer d’argent ? Et si oui, existe-t-il des précédents historiques où l’écart entre les deux était aussi grand ?
Les LLM semblent particuliers en ce que les attentes des consommateurs sur « à quel point ça doit encore s’améliorer » n’ont pratiquement pas de limite, contrairement à des services comme l’e-mail, faciles à faire monter en charge du point de vue des ressources de calcul
C’est une question très basique, mais je me demande aussi pourquoi ils veulent faire une IPO avant d’avoir un modèle économique durable. Quel est l’avantage ?
D’après les liens postés ici, environ 30 % des dépenses d’Anthropic vont à l’inférence, et les 70 % restants à la R&D, comme le développement du modèle suivant
En tenant compte de cela et en simplifiant les chiffres avec une marge, il suffirait de vendre autour de 1 dollar par million de tokens pour gagner de l’argent
Le tarif API actuel est de 25 dollars par million de tokens, donc je ne doute pas de la rentabilité
En revanche, si on exploite à l’extrême un forfait Max à 200 dollars par mois, on peut aller jusqu’à 10 milliards de tokens par mois, soit 0,02 dollar par million de tokens, ce qui représente une perte énorme, et cela finira par disparaître
En revanche, si on utilise 100 millions de tokens par mois avec un forfait Anthropic à 100 dollars par mois, l’entreprise gagne de l’argent
Pour consommer 10 milliards de tokens par mois, il faut travailler un temps énorme et être vraiment très à l’aise avec l’IA, et ce type de personne utilise probablement déjà l’IA depuis des années, y compris avant Opus
Elle serait déçue de perdre Opus, mais c’est aussi précisément le genre d’utilisateur capable de bien exploiter des modèles moins puissants, et dans quelques années, elle pourra probablement migrer vers des modèles open source hébergés en interne tout en restant autour de 0,02 dollar par million de tokens comme aujourd’hui
Donc je ne suis pas convaincu par l’ambiance pessimiste du texte. La situation va changer, mais ça ne signifie pas la fin de l’usage de l’IA
Je suis d’accord avec le fond du texte, mais le style fait trop LLM
Surtout la structure en sections et des punchlines comme « That is not a rounding error. That is a line item that needs its own budget code. »
C’est assez agaçant, et je le vois beaucoup moins sur Gemini avec le même prompt
Il n’y a pas de nom d’auteur
Brad Gerstner a confirmé que les tokens n’étaient pas vendus à perte
Quelle que soit la manière dont la formule répartit API et abonnements, les entreprises dégagent un bénéfice sur la seule vente nette de tokens
Si on inclut les salaires et les rémunérations en actions, elles peuvent être en perte, mais les tokens eux-mêmes sont aujourd’hui rentables
C’est peut-être vrai à cet instant, mais ce n’est pas ainsi qu’elle est arrivée là
Il y a des milliers de milliards de dollars d’investissements à amortir pour, au mieux, quelques dizaines de milliards de chiffre d’affaires, donc le calcul selon lequel les tokens seront bénéficiaires à court terme ne tient pas
L’inférence ne doit pas seulement être rentable en soi, elle doit aussi absorber ce coût
[0] https://epoch.ai/data-insights/openai-compute-spend
Les pertes sont roulées dans une structure étrange de financement circulaire, et cela pourrait finir par s’effondrer dans une crise de la dette
Je pense qu’ils sont fortement subventionnés, mais ce sont les seuls pour lesquels je perçois une vraie valeur
Le problème de l’« IA » dans son ensemble, c’est qu’on peut très bien vivre sans
Les entreprises d’IA le savent, les utilisateurs le savent, et même les managers les plus favorables aux agents IA le savent
Si on supprimait toute l’IA du monde dès maintenant, le résultat serait simplement un retour au travail habituel
Le texte n’insiste pas assez là-dessus. On est censé avoir peur du jour où il faudra confier la review de PR à de vrais ingénieurs ?
Plus la technologie s’intègre en profondeur, moins cela reste vrai
On aurait pu dire la même chose des moteurs électriques quelques années après leur apparition : il suffisait de revenir à la vapeur
Mais aujourd’hui, essayer de vivre sans moteurs électriques ferait s’effondrer la société
La question n’est pas de savoir si on peut s’en passer maintenant, mais si on pourra encore s’en passer dans 5 à 10 ans, une fois l’intégration complète
Non pas pour générer un chiffre d’affaires honnête, mais pour enfoncer les produits IA si profondément qu’« enlever l’IA » ne paraisse plus être une option
Même si les coûts de maintenance continuent à grimper au-delà du niveau des sauvetages publics façon compagnies aériennes
Une nouvelle couche intermédiaire d’extraction de richesse vendue sur de fausses promesses
Au moins pour écrire du JavaScript, je ne peux plus me passer de l’IA
On a l’impression qu’on les traite comme un animal de compagnie qui mourrait si on ne l’utilisait pas de temps en temps
Ce texte a tort. Ces abonnements ne sont pas absents de l’offre entreprise
Les entreprises paient des montants bien plus proches des prix API
La stratégie consiste à habituer les particuliers aux tokens illimités, puis à espérer que ce comportement se transfère au travail
Les sièges team ou enterprise sont plus chers que les prix grand public, mais restent à tarif fixe avec remise à zéro des limites d’usage
On peut attribuer aux membres des sièges équivalents aux forfaits à 20/100/200 dollars par mois, ou tout faire en paiement à l’usage
Il y a plusieurs façons d’acheter
Il existe aussi des forfaits à l’usage équivalents aux offres grand public
Dans mon entreprise, on est facturés en fonction de l’usage API
« Globalement, le schéma est le même. Une tarification pour l’adoption, pas pour l’économie. Enfermer les organisations. Faire de l’IA l’élément porteur du travail quotidien de chaque équipe. On verra la facture plus tard. »
10 000 dollars par mois, ce n’est pas rien, mais si cela permet de soutenir une équipe de 10 à 20 ingénieurs, c’est un très bon levier
Je n’ai pas lu le texte original jusqu’au bout, mais j’ai su reconnaître qu’il avait été écrit par une IA
OpenRouter peut peut-être servir de point de référence pour le coût fournisseur de l’IA
J’entends souvent dire que c’est plus rentable que Claude ; si c’est vrai, cela suggère soit qu’Anthropic est particulièrement inefficace, soit qu’Anthropic fait une marge sur l’inférence
Ils peuvent perdre de l’argent sur l’entraînement, mais c’est peut-être simplement le coût à payer pour rester un laboratoire de pointe
Si une entreprise donnée s’effondre à cause de sa dette ou autre, les clients entreprise n’auront-ils pas simplement à changer de fournisseur ?
Si je vois encore une fois des tournures comme « It’s not X. It’s Y. » ou l’usage métaphorique de « load-bearing », je vais vomir
« L’ère des subventions ne se termine pas avec élégance. Elle se fissure de partout. »
« La question n’est pas de savoir si c’était une bonne affaire. C’est de savoir combien de temps elle peut tenir. »
« Les développeurs qui font tourner trois ou quatre agents de codage en parallèle ne consomment pas 3x ou 4x les tokens d’une conversation de chat. Ils en consomment un ordre de grandeur de plus. »
« Ce ne sont plus des expériences. Ce sont des workflows porteurs. »
« Ce n’est pas une erreur d’arrondi. C’est une ligne budgétaire qui exige son propre code. »
On peut au moins l’espérer
Il y avait des données et la logique semblait se tenir, mais vers le milieu on tombe sur un exemple tendance, puis un autre, puis un troisième, puis le « ce n’est pas simplement X, c’est Y »
C’est aussi irritant que de lire un texte bien écrit, cliquer sur le lien de la source, et se faire rickroller
Les clients enterprise n’utilisent pas un abonnement Claude Pro à 20 dollars par mois
Dans notre entreprise, on donne aux développeurs une limite d’usage d’environ 1 000 dollars par mois, et de ce que je vois, l’économie par rapport au coût API est de 30 % tout au plus
On n’est pas à un niveau de subvention délirant
Pour les autres métiers, c’est souvent limité à 50 dollars par mois, et ces personnes consomment quand même tout leur quota
GitHub Copilot fonctionne ainsi depuis longtemps avec ses sièges business et enterprise, mais il va bientôt atteindre ses limites
Je pense qu’après juin, le réalignement des comptes Pro et Pro+ grand public va rattraper rapidement la situation
OpenAI semble distribuer des tokens à tout-va pour verrouiller les clients, donc ce qui m’inquiète le plus, c’est un changement brutal des prix et des conditions chez OpenAI après l’IPO
Anthropic agit déjà de manière responsable sur ce point, et GitHub Copilot essaiera aussi de corriger ses subventions excessives dans les prochains mois
Parce qu’ils facturaient à la requête, pas au token
Une requête à 3 centimes pouvait brûler plus de 20 dollars en équivalent tokens, et ce système prend fin ce mois-ci
Je m’inquiétais aussi parce que je traite de gros blocs de travail avec GHCP, mais le nouvel estimateur de facturation m’a montré qu’au tarif API j’étais autour de 150 à 200 dollars par mois
Ça reste une subvention sur un abonnement à 20 dollars par mois, mais pas quelque chose de complètement fou
Si on utilise sérieusement et de manière responsable des outils de codage agentiques, on tombera probablement autour des 200 dollars par mois au prix API
Si le fournisseur gagne encore de l’argent à ce niveau de prix, ce n’est pas difficile à accepter pour une entreprise occidentale qui emploie des développeurs, vu le temps économisé
Le vrai risque concerne les vibe coders sur des projets personnels
L’époque où l’on abusait de forfaits subventionnés pour construire d’énormes apps touche à sa fin
S’ils remplacent un développeur, il est logique qu’ils coûtent plus cher que 20 ou 100 dollars par mois
Le vrai problème des entreprises de LLM, c’est qu’elles n’ont pas encore démontré la valeur en dehors du code
Sans cela, elles seront rabaissées au rang de simples outils de codage
C’est pour cela qu’elles se dépêchent, et que la vraie question est de savoir quels workflows elles peuvent encore automatiser davantage
Il est possible qu’elles puissent automatiser toute la paperasse
Si d’autres domaines se développent, elles changeront leur modèle de tarification
Cela peut avoir de la valeur