- Le calcul à 5 000 dollars du forfait Claude Code Max cité par Forbes repose sur le prix de détail de l’API, et non sur le coût réel du compute
- En comparant les prix des modèles Qwen 3.5 397B et Kimi K2.5 sur OpenRouter, on constate que des modèles d’ampleur comparable sont exploités à environ un dixième des tarifs de l’API d’Anthropic
- Sur cette base, le coût réel estimé pour Anthropic serait d’environ 500 dollars, soit seulement une perte mensuelle d’environ 300 dollars pour certains utilisateurs intensifs
- La plupart des utilisateurs n’atteignent pas leur limite de tokens et, sur la base de l’usage moyen, le modèle est à l’équilibre ou rentable
- L’idée que le coût de l’inférence IA serait excessif est erronée ; elle sert à justifier les marges élevées des grandes entreprises d’IA sur leurs API
Vérification de l’affirmation des 5 000 dollars de Forbes
- Forbes a indiqué dans un article sur Cursor que le forfait à 200 dollars d’Anthropic permettait jusqu’à 5 000 dollars d’usage compute
- La citation est présentée comme provenant de « quelqu’un ayant vu une analyse des schémas d’utilisation du compute de l’entreprise »
- Ce chiffre est calculé sur la base du prix de détail de l’API, et ne correspond donc pas au coût réel du compute
- Les tarifs de l’API Opus 4.6 d’Anthropic sont fixés à 5 dollars par million de tokens en entrée et 25 dollars par million de tokens en sortie
- À ce tarif, les utilisateurs intensifs peuvent effectivement atteindre l’équivalent de 5 000 dollars d’utilisation API par mois
Estimation du coût réel du compute
- Sur OpenRouter, le modèle Qwen 3.5 397B-A17B, de taille comparable, est proposé autour de 0,39 dollar par million de tokens en entrée et 2,34 dollars en sortie
- Le modèle Kimi K2.5 est encore moins cher, à 0,45 dollar en entrée et 2,25 dollars en sortie
- Cela correspond à un niveau environ 10 fois moins cher que les tarifs API d’Anthropic
- Le coût des tokens mis en cache présente un écart similaire
- Par exemple : chez DeepInfra, la lecture de cache pour Kimi K2.5 coûte 0,07 dollar/MTok, contre 0,50 dollar/MTok chez Anthropic
- On peut donc estimer que le coût réel du compute représente environ 10 % du prix facturé par l’API
Coût réel des utilisateurs de Claude Code Max
- Pour un utilisateur consommant l’équivalent de 5 000 dollars de tokens au tarif API, le coût réel serait d’environ 500 dollars
- Dans ce cas, Anthropic perdrait environ 300 dollars par mois
- Cependant, Anthropic indique que moins de 5 % des utilisateurs atteignent leur limite de tokens
- L’utilisateur moyen consomme généralement moins de 50 % de son quota de tokens
- D’après les données
/cost d’Anthropic, un utilisateur moyen représente environ 6 dollars d’usage API par jour, et 90 % restent sous les 12 dollars
- En coût réel, cela représente environ 18 dollars par mois, ce qui permet de préserver la rentabilité face à des abonnements de 20 à 200 dollars
Différence de coût avec Cursor
- Le chiffre des 5 000 dollars provient d’une analyse interne de Cursor
- Cursor doit utiliser Opus 4.6 d’Anthropic au tarif API de détail
- Du point de vue de Cursor, un power user peut donc coûter jusqu’à 5 000 dollars par mois
- En revanche, le coût réel pour Anthropic serait plutôt d’environ 500 dollars
- Cursor rencontre des difficultés du fait que les développeurs préfèrent les modèles d’Anthropic
Structure de revenus d’Anthropic et malentendu
- Anthropic reste globalement déficitaire en raison des coûts d’entraînement, des salaires et des investissements massifs en compute
- En revanche, le coût unitaire de l’inférence par token pourrait être fortement rentable
- L’idée selon laquelle « l’inférence IA est une activité déficitaire » sert à justifier des marges excessives sur les prix des API et freine la concurrence
- Pour comprendre l’économie réelle de l’inférence, il est plus pertinent de se référer aux prix publics des modèles sur OpenRouter
- Ceux-ci ne représentent qu’une fraction du coût facturé par les grandes entreprises d’IA sur leurs API
Aucun commentaire pour le moment.