L’affirmation selon laquelle Claude Code coûterait 5 000 dollars par utilisateur à Anthropic est fausse

(martinalderson.com)

1 points par GN⁺ 2026-03-11 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Le calcul à 5 000 dollars du forfait Claude Code Max cité par Forbes repose sur le prix de détail de l’API, et non sur le coût réel du compute
En comparant les prix des modèles Qwen 3.5 397B et Kimi K2.5 sur OpenRouter, on constate que des modèles d’ampleur comparable sont exploités à environ un dixième des tarifs de l’API d’Anthropic
Sur cette base, le coût réel estimé pour Anthropic serait d’environ 500 dollars, soit seulement une perte mensuelle d’environ 300 dollars pour certains utilisateurs intensifs
La plupart des utilisateurs n’atteignent pas leur limite de tokens et, sur la base de l’usage moyen, le modèle est à l’équilibre ou rentable
L’idée que le coût de l’inférence IA serait excessif est erronée ; elle sert à justifier les marges élevées des grandes entreprises d’IA sur leurs API

Vérification de l’affirmation des 5 000 dollars de Forbes

Forbes a indiqué dans un article sur Cursor que le forfait à 200 dollars d’Anthropic permettait jusqu’à 5 000 dollars d’usage compute
- La citation est présentée comme provenant de « quelqu’un ayant vu une analyse des schémas d’utilisation du compute de l’entreprise »
Ce chiffre est calculé sur la base du prix de détail de l’API, et ne correspond donc pas au coût réel du compute
Les tarifs de l’API Opus 4.6 d’Anthropic sont fixés à 5 dollars par million de tokens en entrée et 25 dollars par million de tokens en sortie
- À ce tarif, les utilisateurs intensifs peuvent effectivement atteindre l’équivalent de 5 000 dollars d’utilisation API par mois

Sur OpenRouter, le modèle Qwen 3.5 397B-A17B, de taille comparable, est proposé autour de 0,39 dollar par million de tokens en entrée et 2,34 dollars en sortie
- Le modèle Kimi K2.5 est encore moins cher, à 0,45 dollar en entrée et 2,25 dollars en sortie
Cela correspond à un niveau environ 10 fois moins cher que les tarifs API d’Anthropic
Le coût des tokens mis en cache présente un écart similaire
- Par exemple : chez DeepInfra, la lecture de cache pour Kimi K2.5 coûte 0,07 dollar/MTok, contre 0,50 dollar/MTok chez Anthropic
On peut donc estimer que le coût réel du compute représente environ 10 % du prix facturé par l’API

Pour un utilisateur consommant l’équivalent de 5 000 dollars de tokens au tarif API, le coût réel serait d’environ 500 dollars
- Dans ce cas, Anthropic perdrait environ 300 dollars par mois
Cependant, Anthropic indique que moins de 5 % des utilisateurs atteignent leur limite de tokens
- L’utilisateur moyen consomme généralement moins de 50 % de son quota de tokens
D’après les données /cost d’Anthropic, un utilisateur moyen représente environ 6 dollars d’usage API par jour, et 90 % restent sous les 12 dollars
- En coût réel, cela représente environ 18 dollars par mois, ce qui permet de préserver la rentabilité face à des abonnements de 20 à 200 dollars

Le chiffre des 5 000 dollars provient d’une analyse interne de Cursor
- Cursor doit utiliser Opus 4.6 d’Anthropic au tarif API de détail
Du point de vue de Cursor, un power user peut donc coûter jusqu’à 5 000 dollars par mois
- En revanche, le coût réel pour Anthropic serait plutôt d’environ 500 dollars
Cursor rencontre des difficultés du fait que les développeurs préfèrent les modèles d’Anthropic

Anthropic reste globalement déficitaire en raison des coûts d’entraînement, des salaires et des investissements massifs en compute
En revanche, le coût unitaire de l’inférence par token pourrait être fortement rentable
L’idée selon laquelle « l’inférence IA est une activité déficitaire » sert à justifier des marges excessives sur les prix des API et freine la concurrence
Pour comprendre l’économie réelle de l’inférence, il est plus pertinent de se référer aux prix publics des modèles sur OpenRouter
- Ceux-ci ne représentent qu’une fraction du coût facturé par les grandes entreprises d’IA sur leurs API