Les abonnements IA sont une bombe à retardement pour l’entreprise

(thestateofbrand.com)

7 points par GN⁺ 2026-05-18 | 7 commentaires | Partager sur WhatsApp

OpenAI, Anthropic, Google et d’autres proposent aux entreprises des abonnements à un prix inférieur au coût réel de fourniture, ce qui peut provoquer un choc budgétaire majeur lors d’un futur réajustement tarifaire
Le forfait mensuel à 20 dollars de Claude Pro et ChatGPT Plus peut correspondre, pour les gros utilisateurs, à un coût API réel allant jusqu’à 200 à 400 dollars par siège et par mois
L’IA agentique augmente fortement la consommation de tokens via une exécution autonome prolongée, et GitHub Copilot passera lui aussi à une facturation à l’usage en juin 2026
Pour une équipe de 50 personnes, un abonnement mensuel de 1 000 dollars peut représenter en réalité 15 000 à 40 000 dollars par mois en coût basé sur les tokens, ce qui accroît fortement l’exposition budgétaire
La préparation d’une IPO chez OpenAI et Anthropic renforce la pression sur les marges et l’économie unitaire, ce qui pourrait accélérer les hausses de prix, les limitations d’usage et le passage à une facturation basée sur la consommation

L’écart entre le prix des abonnements IA et leur coût réel

OpenAI, Anthropic, Google et d’autres grands fournisseurs d’IA proposent leurs services aux entreprises à des prix d’abonnement inférieurs au coût réel de fourniture. Si les entreprises prennent ces tarifs comme une référence durable et construisent leurs flux de travail dessus, elles risquent de subir un choc budgétaire important lors d’un futur ajustement des prix
Claude Pro propose pour 20 dollars par mois Sonnet 4.6, Opus 4.6, la recherche web, l’exécution de code, la génération de fichiers, ainsi qu’un volume d’usage environ 5 fois supérieur au niveau gratuit
Selon la tarification API, Sonnet 4.6 coûte 3 dollars par million de tokens en entrée et 15 dollars par million de tokens en sortie, tandis qu’Opus 4.6 coûte 5 dollars par million de tokens en entrée et 25 dollars par million de tokens en sortie
Un travailleur du savoir qui utilise Claude plusieurs heures par jour pour téléverser des documents, rédiger des rapports et faire de l’analyse de données peut consommer plusieurs millions de tokens par semaine. Converti en tarification API, cela peut monter à 200 à 400 dollars par siège et par mois
Microsoft aurait perdu plus de 20 dollars par utilisateur et par mois sur GitHub Copilot, et le coût de calcul d’un gros utilisateur abonné à 10 dollars par mois serait monté jusqu’à 80 dollars
Une analyse indique aussi que des utilisateurs d’Anthropic ont consommé plus de 8 dollars de calcul pour 1 dollar de revenu d’abonnement. Nick Turley, VP produit chez OpenAI, a décrit la tarification des abonnements comme une structure installée presque par hasard et a comparé la possible suppression progressive des forfaits illimités à l’électricité en usage illimité
ChatGPT Plus est resté à 20 dollars par mois pendant trois ans, alors que ses fonctionnalités se sont enrichies entre-temps avec la génération d’images, l’interprétation de code, le mode vocal, le raisonnement agentique et la recherche web

La stratégie tarifaire commune des principaux fournisseurs

Google regroupe Gemini Advanced dans l’offre Google One AI Premium à 20 dollars par mois, tout en facturant séparément l’accès API au même modèle
Meta distribue Llama gratuitement et subventionne, via ses revenus publicitaires, le coût de calcul de centaines de millions de requêtes IA exécutées sur ses propres plateformes
Le Grok de xAI a fixé un prix API d’entrée bas, à 0,20 dollar par million de tokens, dans une logique présentée comme acceptant des pertes pour gagner des parts de marché
Le schéma commun consiste à fixer les prix en privilégiant l’adoption plutôt que la rentabilité, à verrouiller les organisations et à faire de l’IA un élément central du travail quotidien de chaque équipe, tout en repoussant à plus tard la question du coût
OpenAI perdrait de l’argent sur les abonnés grand public et étudierait un recentrage stratégique vers l’entreprise, où l’économie unitaire serait relativement moins défavorable
Selon le Wall Street Journal, OpenAI a manqué certains objectifs majeurs de revenus et d’utilisateurs en chemin vers une IPO, et le modèle tarifaire subventionné montre déjà des fissures

L’IA agentique aggrave la structure de coûts

Dans l’usage chatbot, les questions-réponses généraient une consommation de tokens relativement prévisible, mais l’IA agentique augmente fortement le volume utilisé via des exécutions autonomes de longue durée
Les sessions de Claude Code s’exécutent de manière autonome pendant de longues périodes et consomment des tokens à un rythme bien plus élevé qu’un usage conversationnel
Certains utilisateurs disent avoir épuisé une fenêtre de limitation de débit de 5 heures en 90 minutes
GitHub a annoncé que, le modèle forfaitaire s’étant effondré face aux charges de travail agentiques, Copilot passerait à une facturation à l’usage à partir du 1er juin 2026
GitHub explique que Copilot a fortement évolué et que l’usage agentique « devient la norme », ce qui augmente les besoins en calcul et en inférence
Sam Altman a déclaré publiquement qu’OpenAI devait désormais devenir une entreprise d’inférence IA, ce qui rejoint l’idée qu’un usage agentique nécessite fondamentalement un modèle économique différent
Dans les équipes d’ingénierie, des Agent Teams où plusieurs instances IA traitent un même projet en parallèle font exploser les coûts. Si un développeur exécute en même temps 3 ou 4 agents de code, l’usage de tokens peut dépasser non pas de quelques fois, mais d’un ordre de grandeur entier celui d’une simple conversation

Une exposition aux coûts que les entreprises ne mesurent pas

Depuis deux ans, beaucoup d’entreprises ont intégré les abonnements IA au cœur de leurs opérations : le marketing rédige avec ChatGPT Plus, l’ingénierie code et révise avec Claude Pro, et les équipes de recherche, de customer success ou de finance utilisent aussi l’IA pour résumer des documents, synthétiser des tickets ou modéliser des scénarios
Si 50 personnes utilisent Claude Pro, le coût actuel est de 1 000 dollars par mois. Pour ChatGPT Plus, on est au même niveau, ce qui donne l’impression que l’IA n’est qu’une petite ligne dans le compte de résultat
Mais si l’on calcule l’usage API réel de cette même équipe sur la base de la consommation de tokens, le montant peut atteindre 15 000 à 40 000 dollars par mois selon l’intensité d’usage, transformant le sujet en poste budgétaire dédié
Quand les prix seront réajustés, les entreprises qui considéraient l’IA à 20 dollars par mois comme un intrant durablement bon marché risquent de recevoir une facture non prévue, alors même que l’outil sera déjà profondément intégré aux workflows et difficile à retirer
Les subventions créent une dépendance, et cette dépendance devient un piège qui rend les hausses de prix difficiles à éviter
Le Q1 2026 AI Quarterly Pulse de KPMG indique que les organisations américaines prévoient en moyenne 207 millions de dollars de dépenses IA sur les 12 prochains mois, soit presque le double sur un an
Selon une enquête de recherche Goldman Sachs, de nombreuses grandes entreprises dépassent déjà leur budget IA de plusieurs ordres de grandeur, et les dépenses IA pourraient bientôt rivaliser avec les salaires des ingénieurs
Swami Chandrasekaran, responsable du laboratoire IA et données de KPMG North America, a déclaré à Marketplace qu’il y a seulement un ou deux trimestres, personne ne se préoccupait vraiment du coût de consommation des LLM
L’économiste Brian Jabarian, de l’University of Chicago, qui conseille les entreprises sur leur transformation IA, estime que le moment de la facture approche

L’IPO pourrait imposer un réajustement tarifaire

OpenAI et Anthropic préparent une IPO, et ce processus pourrait accentuer la pression visant à réduire l’écart entre prix d’abonnement et coût réel
Anthropic aurait dépassé les 30 milliards de dollars de revenus annualisés, en hausse par rapport à 9 milliards de dollars fin 2025
OpenAI serait sur un rythme de revenus d’environ 25 milliards de dollars
OpenAI prévoirait 115 milliards de dollars de consommation de trésorerie cumulée d’ici 2029 et se serait engagé sur 665 milliards de dollars de dépenses de calcul d’ici 2030
Oracle aurait assumé 43 milliards de dollars de dette sur un seul exercice fiscal pour construire des datacenters destinés à OpenAI
Tant qu’elles restent privées et brûlent du capital-risque, ces entreprises peuvent subventionner les coûts d’inférence, exploiter les modèles à perte et maintenir des forfaits à 20 dollars par mois dont le coût de fourniture dépasse 100 dollars
Après l’IPO, les marchés publics demanderont des marges, les analystes exigeront une économie unitaire crédible, et les investisseurs voudront une trajectoire de rentabilité qui ne repose pas sur un financement illimité
Les moyens les plus rapides de réduire cet écart tarifaire sont les hausses de prix, les limitations d’usage et le passage à une facturation basée sur la consommation, trois évolutions qui pourraient toutes avoir un impact important sur les abonnés entreprises actuels

Des signaux de réajustement déjà visibles

GitHub passera à une facturation à l’usage le 1er juin 2026, en remplaçant les requêtes premium forfaitaires par des AI Credits basés sur les tokens
Microsoft a augmenté deux fois les prix de Microsoft 365 en quatre ans, et la hausse la plus récente est directement liée au coût de l’infrastructure IA
OpenAI a introduit un palier Pro à 100 dollars comme nouveau vrai niveau de prix pour les gros utilisateurs
Le palier Max à 200 dollars par mois d’Anthropic illustre ce que pourrait réellement coûter un usage soutenu une fois les subventions terminées
Geoff Webb, VP chez Conga, estime que l’ampleur de la course à la conquête du marché de l’IA est gigantesque, tout comme le coût pour la dominer, ce qui rend probables des changements rapides et majeurs dans les modèles économiques et les prix des services au moment de la monétisation et du retour sur investissement

Ce que les dirigeants d’entreprise doivent faire dès maintenant

Les entreprises doivent auditer la consommation réelle de tokens par équipe, au lieu de se contenter de compter les sièges
Elles doivent modéliser l’évolution du coût IA dans des scénarios à 2x, 5x et 10x par rapport aux prix actuels
Elles doivent intégrer dans leur stack une option de choix fournisseur afin qu’un changement de prix d’un seul acteur ne fasse pas s’effondrer brutalement le budget
Elles doivent discuter de cet écart de coût avec le CFO avant que le CFO ne soulève lui-même le problème
L’écart entre ce que l’organisation paie aujourd’hui pour l’IA et ce qu’elle paiera dans 18 mois pourrait devenir l’une des plus fortes hausses de poste de dépense que beaucoup d’entreprises auront à absorber
Certaines entreprises pourraient devoir expliquer pourquoi un outil qui coûtait auparavant moins cher qu’un déjeuner d’équipe exige soudain un budget annuel à six chiffres
L’ère des subventions touche à sa fin, et beaucoup d’entreprises n’ont toujours pas commencé cette discussion

7 commentaires

hmmhmmhm 2026-05-18

On dirait le même problème qu’à l’époque des mainframes..
Si on est dans une configuration où les serveurs sont chers et les ressources limitées, tandis que les ordinateurs personnels sont lents,
au final les serveurs finiront aussi par devenir moins chers et les ordinateurs personnels gagneront en performances... J’ai l’impression que le temps apportera la réponse.

GN⁺ 2026-05-18

Réactions sur Hacker News

Tous les abonnements à l’IA sont une bombe à retardement pour les fournisseurs de modèles frontier
D’ici quelques années, on fera tourner pour presque rien des modèles locaux aussi bons que les modèles frontier actuels, et la base du marché entreprise des sociétés frontier s’effondrera
- Je ne vois pas sur quoi repose l’idée qu’« on fera tourner d’ici quelques années des modèles locaux aussi bons que les modèles frontier actuels »
  Rien qu’en regardant les besoins en mémoire, c’est énorme, et pendant encore un bon moment, il sera bien plus rentable d’utiliser du matériel d’hébergement spécialisé mutualisé avec un taux d’utilisation élevé
- Autrement dit, les modèles frontier sont des actifs qui se dévalorisent très vite à cause de la concurrence du marché
  Ils doivent continuer à s’améliorer pour rester devant les autres et les modèles à poids ouverts, donc c’est presque l’inverse d’une bombe à retardement
  Les tokens d’inférence au niveau actuel vont continuer à devenir moins chers, et je ne sais pas si le local sera l’état final vu les exigences matérielles élevées, mais la concurrence tend à pousser les marges vers zéro
  Longue discussion sur ce sujet : https://corecursive.com/the-pre-training-wall-and-the-treadm...
- Au cours du dernier mois, j’ai branché Qwen, Gemma et Deepseek derrière LiteLLM pour créer une petite démo montrant à quoi pourrait ressembler l’avenir
  Je surveille l’usage des tokens et j’avance activement pour réduire les coûts d’inférence et internaliser le tout, au lieu de brûler bêtement des montagnes de tokens
  Mon patron était très content, et on est maintenant en train de le déployer plus largement. Pour moi, c’est ça, l’avenir
- L’idée qu’on fera tourner d’ici quelques années des modèles locaux aussi bons que les modèles frontier actuels me paraît très douteuse
  Les lois d’échelle deviennent déjà lourdes à porter, et il ne faut pas se laisser berner par l’exagération du « tout est exponentiel »
  En plus, le vrai concurrent, ce sont les modèles frontier d’ici deux ans
- Sauf percée majeure dans la production de matériel ou l’architecture des modèles, c’est plutôt l’inverse
  Aujourd’hui, il faut du matériel plus gros, plus cher et plus énergivore qu’il y a 1 ou 2 ans
Le ton excessif des textes des deux camps de l’IA est épuisant
J’aimerais me mettre devant un tableau blanc avec quelqu’un qui comprend vraiment l’économie et le business des fournisseurs de tokens, et lui poser des questions « comme si j’avais cinq ans »
Est-ce un jeu de marges pour les fournisseurs de tokens et un jeu de qualité de service/produit pour les consommateurs ? Si la courbe de la qualité et celle de la marge finissent par se croiser, est-ce une course pour atteindre ce point avant de manquer d’argent ? Et si oui, existe-t-il des précédents historiques où l’écart entre les deux était aussi grand ?
Les LLM semblent particuliers en ce que les attentes des consommateurs sur « à quel point ça doit encore s’améliorer » n’ont pratiquement pas de limite, contrairement à des services comme l’e-mail, faciles à faire monter en charge du point de vue des ressources de calcul
C’est une question très basique, mais je me demande aussi pourquoi ils veulent faire une IPO avant d’avoir un modèle économique durable. Quel est l’avantage ?
- J’ai demandé à une IA le coût de production des tokens Opus, et elle m’a répondu 0,216 dollar par million de tokens, en incluant le matériel, l’électricité, le refroidissement et l’hébergement
  D’après les liens postés ici, environ 30 % des dépenses d’Anthropic vont à l’inférence, et les 70 % restants à la R&D, comme le développement du modèle suivant
  En tenant compte de cela et en simplifiant les chiffres avec une marge, il suffirait de vendre autour de 1 dollar par million de tokens pour gagner de l’argent
  Le tarif API actuel est de 25 dollars par million de tokens, donc je ne doute pas de la rentabilité
  En revanche, si on exploite à l’extrême un forfait Max à 200 dollars par mois, on peut aller jusqu’à 10 milliards de tokens par mois, soit 0,02 dollar par million de tokens, ce qui représente une perte énorme, et cela finira par disparaître
  En revanche, si on utilise 100 millions de tokens par mois avec un forfait Anthropic à 100 dollars par mois, l’entreprise gagne de l’argent
  Pour consommer 10 milliards de tokens par mois, il faut travailler un temps énorme et être vraiment très à l’aise avec l’IA, et ce type de personne utilise probablement déjà l’IA depuis des années, y compris avant Opus
  Elle serait déçue de perdre Opus, mais c’est aussi précisément le genre d’utilisateur capable de bien exploiter des modèles moins puissants, et dans quelques années, elle pourra probablement migrer vers des modèles open source hébergés en interne tout en restant autour de 0,02 dollar par million de tokens comme aujourd’hui
  Donc je ne suis pas convaincu par l’ambiance pessimiste du texte. La situation va changer, mais ça ne signifie pas la fin de l’usage de l’IA
Je suis d’accord avec le fond du texte, mais le style fait trop LLM
Surtout la structure en sections et des punchlines comme « That is not a rounding error. That is a line item that needs its own budget code. »
- Claude produit vraiment énormément de phrases comme ça
  C’est assez agaçant, et je le vois beaucoup moins sur Gemini avec le même prompt
- À la base, je ne sais même pas qui a écrit ce texte
  Il n’y a pas de nom d’auteur
- Pangram signale ce texte avec un niveau de confiance élevé comme étant généré à 100 % par IA
Brad Gerstner a confirmé que les tokens n’étaient pas vendus à perte
Quelle que soit la manière dont la formule répartit API et abonnements, les entreprises dégagent un bénéfice sur la seule vente nette de tokens
Si on inclut les salaires et les rémunérations en actions, elles peuvent être en perte, mais les tokens eux-mêmes sont aujourd’hui rentables
- C’est comme voir une fusée équipée du moteur le plus puissant de la planète couper ses moteurs une fois sortie de l’orbite et dire « elle vole sans propulsion »
  C’est peut-être vrai à cet instant, mais ce n’est pas ainsi qu’elle est arrivée là
  Il y a des milliers de milliards de dollars d’investissements à amortir pour, au mieux, quelques dizaines de milliards de chiffre d’affaires, donc le calcul selon lequel les tokens seront bénéficiaires à court terme ne tient pas
- Les tokens peuvent être vendus avec marge, mais 70 % des dépenses de calcul partent en R&D et en entraînement des modèles[0]
  L’inférence ne doit pas seulement être rentable en soi, elle doit aussi absorber ce coût
  [0] https://epoch.ai/data-insights/openai-compute-spend
- Ce n’est pas vendu à perte, mais ce n’est pas non plus vendu assez cher pour couvrir les pertes et les coûts actuels
  Les pertes sont roulées dans une structure étrange de financement circulaire, et cela pourrait finir par s’effondrer dans une crise de la dette
- Autrement dit, les entreprises d’IA ont un résultat positif avant déduction des coûts
- Je ne sais pas si c’est aussi vrai pour les tokens de Claude Code ou de Codex
  Je pense qu’ils sont fortement subventionnés, mais ce sont les seuls pour lesquels je perçois une vraie valeur
Le problème de l’« IA » dans son ensemble, c’est qu’on peut très bien vivre sans
Les entreprises d’IA le savent, les utilisateurs le savent, et même les managers les plus favorables aux agents IA le savent
Si on supprimait toute l’IA du monde dès maintenant, le résultat serait simplement un retour au travail habituel
Le texte n’insiste pas assez là-dessus. On est censé avoir peur du jour où il faudra confier la review de PR à de vrais ingénieurs ?
- N’est-ce pas toujours le cas au début de l’adoption d’une nouvelle technologie ?
  Plus la technologie s’intègre en profondeur, moins cela reste vrai
  On aurait pu dire la même chose des moteurs électriques quelques années après leur apparition : il suffisait de revenir à la vapeur
  Mais aujourd’hui, essayer de vivre sans moteurs électriques ferait s’effondrer la société
  La question n’est pas de savoir si on peut s’en passer maintenant, mais si on pourra encore s’en passer dans 5 à 10 ans, une fois l’intégration complète
- C’est peut-être justement pour cela qu’ils poussent plus fort
  Non pas pour générer un chiffre d’affaires honnête, mais pour enfoncer les produits IA si profondément qu’« enlever l’IA » ne paraisse plus être une option
  Même si les coûts de maintenance continuent à grimper au-delà du niveau des sauvetages publics façon compagnies aériennes
  Une nouvelle couche intermédiaire d’extraction de richesse vendue sur de fausses promesses
- Si on fait du JavaScript, c’est évidemment vrai
  Au moins pour écrire du JavaScript, je ne peux plus me passer de l’IA
- Je trouve toujours étrange qu’on recommande d’utiliser des outils d’IA même pour des tâches tout à fait banales et générales
  On a l’impression qu’on les traite comme un animal de compagnie qui mourrait si on ne l’utilisait pas de temps en temps
Ce texte a tort. Ces abonnements ne sont pas absents de l’offre entreprise
Les entreprises paient des montants bien plus proches des prix API
La stratégie consiste à habituer les particuliers aux tokens illimités, puis à espérer que ce comportement se transfère au travail
- Ils existent bien
  Les sièges team ou enterprise sont plus chers que les prix grand public, mais restent à tarif fixe avec remise à zéro des limites d’usage
  On peut attribuer aux membres des sièges équivalents aux forfaits à 20/100/200 dollars par mois, ou tout faire en paiement à l’usage
  Il y a plusieurs façons d’acheter
- Les abonnements sont clairement proposés aux entreprises
  Il existe aussi des forfaits à l’usage équivalents aux offres grand public
- J’étais confus sur la raison pour laquelle on parlait d’abonnements entreprise
  Dans mon entreprise, on est facturés en fonction de l’usage API
- En lisant ce genre de paragraphes, ça ressemble davantage à un texte craché par une IA
  « Globalement, le schéma est le même. Une tarification pour l’adoption, pas pour l’économie. Enfermer les organisations. Faire de l’IA l’élément porteur du travail quotidien de chaque équipe. On verra la facture plus tard. »
- En plus, l’ampleur des factures API dramatisées dans le texte reste relativement mineure
  10 000 dollars par mois, ce n’est pas rien, mais si cela permet de soutenir une équipe de 10 à 20 ingénieurs, c’est un très bon levier
Je n’ai pas lu le texte original jusqu’au bout, mais j’ai su reconnaître qu’il avait été écrit par une IA
OpenRouter peut peut-être servir de point de référence pour le coût fournisseur de l’IA
J’entends souvent dire que c’est plus rentable que Claude ; si c’est vrai, cela suggère soit qu’Anthropic est particulièrement inefficace, soit qu’Anthropic fait une marge sur l’inférence
Ils peuvent perdre de l’argent sur l’entraînement, mais c’est peut-être simplement le coût à payer pour rester un laboratoire de pointe
Si une entreprise donnée s’effondre à cause de sa dette ou autre, les clients entreprise n’auront-ils pas simplement à changer de fournisseur ?
Si je vois encore une fois des tournures comme « It’s not X. It’s Y. » ou l’usage métaphorique de « load-bearing », je vais vomir
- J’en ai généré pas mal, et la liste n’est pas courte
  « L’ère des subventions ne se termine pas avec élégance. Elle se fissure de partout. »
  « La question n’est pas de savoir si c’était une bonne affaire. C’est de savoir combien de temps elle peut tenir. »
  « Les développeurs qui font tourner trois ou quatre agents de codage en parallèle ne consomment pas 3x ou 4x les tokens d’une conversation de chat. Ils en consomment un ordre de grandeur de plus. »
  « Ce ne sont plus des expériences. Ce sont des workflows porteurs. »
  « Ce n’est pas une erreur d’arrondi. C’est une ligne budgétaire qui exige son propre code. »
- Si un gros réajustement des prix arrive, beaucoup de gens qui généraient des commentaires sur les réseaux sociaux avec un abonnement gratuit ou à 20 dollars par mois verront peut-être enfin le coût réel et se remettront à écrire eux-mêmes
  On peut au moins l’espérer
- Je déteste aussi l’expression « the unlock »
- Le début du texte était correct
  Il y avait des données et la logique semblait se tenir, mais vers le milieu on tombe sur un exemple tendance, puis un autre, puis un troisième, puis le « ce n’est pas simplement X, c’est Y »
  C’est aussi irritant que de lire un texte bien écrit, cliquer sur le lien de la source, et se faire rickroller
Les clients enterprise n’utilisent pas un abonnement Claude Pro à 20 dollars par mois
Dans notre entreprise, on donne aux développeurs une limite d’usage d’environ 1 000 dollars par mois, et de ce que je vois, l’économie par rapport au coût API est de 30 % tout au plus
On n’est pas à un niveau de subvention délirant
Pour les autres métiers, c’est souvent limité à 50 dollars par mois, et ces personnes consomment quand même tout leur quota
GitHub Copilot fonctionne ainsi depuis longtemps avec ses sièges business et enterprise, mais il va bientôt atteindre ses limites
Je pense qu’après juin, le réalignement des comptes Pro et Pro+ grand public va rattraper rapidement la situation
OpenAI semble distribuer des tokens à tout-va pour verrouiller les clients, donc ce qui m’inquiète le plus, c’est un changement brutal des prix et des conditions chez OpenAI après l’IPO
Anthropic agit déjà de manière responsable sur ce point, et GitHub Copilot essaiera aussi de corriger ses subventions excessives dans les prochains mois
- Seul GitHub Copilot a vraiment pratiqué des subventions absurdes
  Parce qu’ils facturaient à la requête, pas au token
  Une requête à 3 centimes pouvait brûler plus de 20 dollars en équivalent tokens, et ce système prend fin ce mois-ci
  Je m’inquiétais aussi parce que je traite de gros blocs de travail avec GHCP, mais le nouvel estimateur de facturation m’a montré qu’au tarif API j’étais autour de 150 à 200 dollars par mois
  Ça reste une subvention sur un abonnement à 20 dollars par mois, mais pas quelque chose de complètement fou
  Si on utilise sérieusement et de manière responsable des outils de codage agentiques, on tombera probablement autour des 200 dollars par mois au prix API
  Si le fournisseur gagne encore de l’argent à ce niveau de prix, ce n’est pas difficile à accepter pour une entreprise occidentale qui emploie des développeurs, vu le temps économisé
  Le vrai risque concerne les vibe coders sur des projets personnels
  L’époque où l’on abusait de forfaits subventionnés pour construire d’énormes apps touche à sa fin
S’ils remplacent un développeur, il est logique qu’ils coûtent plus cher que 20 ou 100 dollars par mois
Le vrai problème des entreprises de LLM, c’est qu’elles n’ont pas encore démontré la valeur en dehors du code
Sans cela, elles seront rabaissées au rang de simples outils de codage
C’est pour cela qu’elles se dépêchent, et que la vraie question est de savoir quels workflows elles peuvent encore automatiser davantage
Il est possible qu’elles puissent automatiser toute la paperasse
Si d’autres domaines se développent, elles changeront leur modèle de tarification
- Elles essaient aussi, dans une certaine mesure, de remplacer Figma
  Cela peut avoir de la valeur

taekim34 2026-05-19

Pour économiser des tokens, il est important de pouvoir vérifier en temps réel « combien j’utilise en ce moment ». En particulier, comme la facturation basée sur les tokens peut augmenter de manière non linéaire selon les usages, contrairement à un abonnement, il faut pouvoir voir à l’échelle de la session d’où viennent les fuites de coûts afin de réagir. Si vous êtes dans un environnement Claude Code, essayez donc cc-token-saver (https://github.com/ww-w-ai/cc-token-saver). Il affiche en temps réel les coûts par session et par segment, bloque automatiquement les renvois coûteux quand le cache expire, et délègue automatiquement les tâches lourdes à des SubTask à faible coût.

iolothebard 2026-05-18

On finira par l’utiliser de toute façon.
L’iPhone 3 coûtait 200 à 300 dollars… aujourd’hui, on est largement au-dessus des 1 000 dollars et on l’utilise quand même. On y a déjà pris goût.

prunusnira 2026-05-18

On dirait que les déploiements de LLM en local vont devenir de plus en plus nombreux.

master6559 2026-05-18

Si c'est trop cher, il suffit de ne pas l'utiliser..

aer0700 2026-05-18

On peut se dire que si, malgré les prix, les gens continueront à payer, c’est probablement pour cela que les fournisseurs de LLM augmentent leurs tarifs. Je me demande ce qu’il adviendra à l’avenir des LLM open source comme GLM, qwen ou deepseek. Les gens vont commencer à calculer s’il vaut vraiment la peine de payer ce prix pour utiliser des modèles de pointe, ou s’il ne vaut pas mieux utiliser de l’open source, quitte à faire l’effort de mettre en place sa propre infrastructure vLLM.