- Dans des schémas d’usage de type agent, l’utilisation via abonnement offre un rapport qualité-prix jusqu’à 36 fois supérieur
- L’offre « Max 5x » permet en pratique d’aller au-delà de ce qui est annoncé par le marketing, avec une limite par session multipliée par 6 et une limite hebdomadaire multipliée par 8,3
- L’offre « Max 20x » n’étend les capacités par 20 que sur la base de sessions de 5 heures ; sa limite hebdomadaire reste proche du double de Max 5x
- Dans l’interface web, le coût de réutilisation d’un contexte mis en cache est nul, alors que l’API refacture 10 % du coût d’entrée lorsqu’un même contexte est renvoyé
- Les chiffres des limites d’abonnement ont été reconstitués à partir des valeurs d’utilisation en virgule flottante, ce qui a permis d’analyser finement la structure interne des crédits et des tokens
Contexte de l’analyse et méthode
- Les valeurs décimales d’utilisation anormalement précises affichées dans l’interface web de Claude reflètent vraisemblablement un calcul interne
- Des valeurs comme
0.16327272727272726semblent provenir d’un système interne de crédits fondé sur des fractions - La méthode consiste à remonter à la fraction d’origine à l’aide d’un Stern–Brocot tree
- Des valeurs comme
- Cela permet de reconstituer les limites réelles par session, les limites hebdomadaires et l’unité de crédit
Différence de structure de coûts entre abonnement web et API
- L’abonnement web de Claude n’entraîne aucun coût d’entrée supplémentaire, même lorsqu’un même contexte de conversation est réutilisé
- Avec l’API, il faut renvoyer le même contexte à chaque requête, et même en cas de cache hit, 10 % du coût des tokens d’entrée sont facturés
- Dans des usages comme le codage de type agent, où de longs contextes sont consommés de façon répétée, l’écart de coût se creuse rapidement
Les limites réelles de l’offre « Max 20x »
- La mention « 20x » ne s’applique qu’à la consommation sur une session de 5 heures
- La limite d’usage cumulée sur une semaine est restreinte à environ 2 fois celle de Max 5x
- L’offre est avantageuse pour un usage intensif de courte durée, mais perd en efficacité sur une utilisation continue de longue durée
L’efficacité réelle de l’offre « Max 5x »
- La limite par session est environ 6 fois supérieure à celle de Pro
- La limite hebdomadaire est environ 8,3 fois supérieure à celle de Pro
- Il s’agit donc d’une offre dont la capacité réelle dépasse l’intitulé commercial
- À 100 $ par mois, elle offre une efficacité de coût écrasante face à l’API
Conclusion sur le rapport coût-efficacité
- Pour les longues sessions de développement et les travaux de type agent comme Claude Code, l’abonnement est bien plus avantageux que l’API
- L’offre « Max 5x » est en particulier le meilleur point d’équilibre entre vitesse, endurance et coût
- Dans la structure actuelle, c’est l’option optimale pour les utilisateurs avancés et les développeurs
Lien de l’article original : suspiciously precise floats, or, how I got Claude's real limits
Synthèse des commentaires Reddit
- Dans l’ensemble, les commentaires approuvent fortement la validité des calculs eux-mêmes réalisés par l’OP
- Le consensus converge notamment sur le fait que l’offre « Max 5x » à 100 $/mois offre le meilleur rapport qualité-prix pour les gros utilisateurs
- Grâce au fait que la réutilisation du cache de contexte est gratuite dans l’interface web, l’écart de coût avec l’API devient très important dans les sessions longues et de type agent
- Plusieurs utilisateurs réels de Max 5x rapportent également qu’ils atteignent rarement les limites, même en l’utilisant toute la journée
- L’affirmation selon laquelle « Max 20x est un piège » est nuancée
- La limite d’usage hebdomadaire totale ne reste qu’à environ 2 fois celle de Max 5x
- En revanche, la limite sur une session de 5 heures est multipliée par 4
- Cela conduit à une distinction claire : 20x pour les pics d’usage à court terme (sprint), 5x pour l’usage soutenu sur la durée (marathon)
- L’avertissement le plus fort porte sur le manque de transparence d’Anthropic
- Toute cette analyse repose sur des chiffres reconstitués
- Les limites internes peuvent changer sans préavis
- Le consensus est que cela peut être utile pour optimiser ses coûts à court terme, mais risqué comme base de décisions business à long terme
- Le conseil le plus utile en pratique concerne l’usage de l’extension Claude Code pour VS Code
- Il est possible de se connecter avec un compte d’abonnement claude.ai au lieu d’une clé API
- Cela permet d’utiliser les limites de l’abonnement sans consommer de crédits API
- Beaucoup ont réagi en disant qu’ils ignoraient complètement ce point
- Un autre sujet soulevé concerne les différences de confidentialité et de conditions d’utilisation
- L’interface web et l’API ont des Terms of Service différents
- Pour du code sensible ou propriétaire, l’usage de l’API est perçu comme plus sûr
- Parmi les avis contraires, certains estiment aussi que les limites d’usage peuvent au contraire améliorer la productivité
- Plus l’usage se rapproche de l’illimité, plus les prompts ont tendance à devenir verbeux et inefficaces
- Les limites forceraient à concevoir des prompts plus épurés et plus intentionnels
- Globalement, le ton des commentaires est le suivant
- un consensus pragmatique selon lequel « Max 5x est aujourd’hui le meilleur choix »
- avec en parallèle la prudence qu’« cette structure peut changer à tout moment »
Aucun commentaire pour le moment.