1 points par GN⁺ 2026-03-11 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Le calcul à 5 000 dollars du forfait Claude Code Max cité par Forbes repose sur le prix de détail de l’API, et non sur le coût réel du compute
  • En comparant les prix des modèles Qwen 3.5 397B et Kimi K2.5 sur OpenRouter, on constate que des modèles d’ampleur comparable sont exploités à environ un dixième des tarifs de l’API d’Anthropic
  • Sur cette base, le coût réel estimé pour Anthropic serait d’environ 500 dollars, soit seulement une perte mensuelle d’environ 300 dollars pour certains utilisateurs intensifs
  • La plupart des utilisateurs n’atteignent pas leur limite de tokens et, sur la base de l’usage moyen, le modèle est à l’équilibre ou rentable
  • L’idée que le coût de l’inférence IA serait excessif est erronée ; elle sert à justifier les marges élevées des grandes entreprises d’IA sur leurs API

Vérification de l’affirmation des 5 000 dollars de Forbes

  • Forbes a indiqué dans un article sur Cursor que le forfait à 200 dollars d’Anthropic permettait jusqu’à 5 000 dollars d’usage compute
    • La citation est présentée comme provenant de « quelqu’un ayant vu une analyse des schémas d’utilisation du compute de l’entreprise »
  • Ce chiffre est calculé sur la base du prix de détail de l’API, et ne correspond donc pas au coût réel du compute
  • Les tarifs de l’API Opus 4.6 d’Anthropic sont fixés à 5 dollars par million de tokens en entrée et 25 dollars par million de tokens en sortie
    • À ce tarif, les utilisateurs intensifs peuvent effectivement atteindre l’équivalent de 5 000 dollars d’utilisation API par mois

Estimation du coût réel du compute

  • Sur OpenRouter, le modèle Qwen 3.5 397B-A17B, de taille comparable, est proposé autour de 0,39 dollar par million de tokens en entrée et 2,34 dollars en sortie
    • Le modèle Kimi K2.5 est encore moins cher, à 0,45 dollar en entrée et 2,25 dollars en sortie
  • Cela correspond à un niveau environ 10 fois moins cher que les tarifs API d’Anthropic
  • Le coût des tokens mis en cache présente un écart similaire
    • Par exemple : chez DeepInfra, la lecture de cache pour Kimi K2.5 coûte 0,07 dollar/MTok, contre 0,50 dollar/MTok chez Anthropic
  • On peut donc estimer que le coût réel du compute représente environ 10 % du prix facturé par l’API

Coût réel des utilisateurs de Claude Code Max

  • Pour un utilisateur consommant l’équivalent de 5 000 dollars de tokens au tarif API, le coût réel serait d’environ 500 dollars
    • Dans ce cas, Anthropic perdrait environ 300 dollars par mois
  • Cependant, Anthropic indique que moins de 5 % des utilisateurs atteignent leur limite de tokens
    • L’utilisateur moyen consomme généralement moins de 50 % de son quota de tokens
  • D’après les données /cost d’Anthropic, un utilisateur moyen représente environ 6 dollars d’usage API par jour, et 90 % restent sous les 12 dollars
    • En coût réel, cela représente environ 18 dollars par mois, ce qui permet de préserver la rentabilité face à des abonnements de 20 à 200 dollars

Différence de coût avec Cursor

  • Le chiffre des 5 000 dollars provient d’une analyse interne de Cursor
    • Cursor doit utiliser Opus 4.6 d’Anthropic au tarif API de détail
  • Du point de vue de Cursor, un power user peut donc coûter jusqu’à 5 000 dollars par mois
    • En revanche, le coût réel pour Anthropic serait plutôt d’environ 500 dollars
  • Cursor rencontre des difficultés du fait que les développeurs préfèrent les modèles d’Anthropic

Structure de revenus d’Anthropic et malentendu

  • Anthropic reste globalement déficitaire en raison des coûts d’entraînement, des salaires et des investissements massifs en compute
  • En revanche, le coût unitaire de l’inférence par token pourrait être fortement rentable
  • L’idée selon laquelle « l’inférence IA est une activité déficitaire » sert à justifier des marges excessives sur les prix des API et freine la concurrence
  • Pour comprendre l’économie réelle de l’inférence, il est plus pertinent de se référer aux prix publics des modèles sur OpenRouter
    • Ceux-ci ne représentent qu’une fraction du coût facturé par les grandes entreprises d’IA sur leurs API

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.