1 points par GN⁺ 17 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Début mars 2026, le TTL du cache de Claude Code a été modifié de 1 heure à 5 minutes, et ce changement a été constaté, à usage identique, comme provenant d’une différence de configuration côté serveur
  • Avec ce raccourcissement du TTL, le coût de régénération du cache augmente de 20 à 32 % et, lors de longues sessions, la consommation de quota grimpe fortement
  • L’analyse montre un surcoût d’environ 17 % selon les modèles, et certains utilisateurs ont commencé à atteindre la limite de quota sur 5 heures
  • Anthropic a expliqué que le changement du 6 mars était intentionnel, avec un TTL appliqué différemment selon les requêtes afin de réduire le coût global
  • La communauté critique la hausse des coûts, le manque de transparence et l’absence de préavis, et demande de garantir aux utilisateurs le choix du réglage du TTL

Rapport sur les problèmes de coût et de quota liés au changement du TTL du cache

  • Il a été analysé que la valeur par défaut du TTL du cache de Claude Code d’Anthropic est passée de 1 heure à 5 minutes début mars 2026
    • Analyse fondée sur 119 866 appels d’API entre le 11 janvier et le 11 avril 2026
    • Entre le 6 et le 8 mars, le TTL de 5 minutes réapparaît tandis que celui d’1 heure disparaît progressivement
    • Le phénomène se produisant avec la même version du client et les mêmes usages, il a été confirmé comme un changement de configuration côté serveur
  • Avec ce changement de TTL, le coût de création du cache augmente de 20 à 32 %, et une forte hausse de la consommation de quota chez les abonnés a été observée
    • Avec un TTL de 5 minutes, si une session reste inactive plus de 5 minutes, le cache expire et tout le contexte doit être téléversé à nouveau
    • La régénération du cache est jusqu’à 12,5 fois plus coûteuse qu’une lecture, et le coût s’accumule d’autant plus lors de longues sessions de code
    • En février, quand le TTL d’1 heure était maintenu, le taux de gaspillage était de 1,1 %, mais après mars il a bondi à 15–53 %
  • Résultats de l’analyse des coûts

    • Modèle claude-sonnet-4-6 : coût total 5 561,17 $ → 4 612,09 $ avec un TTL d’1 heure (environ 17,1 % de dépense excédentaire)
    • Modèle claude-opus-4-6 : coût total 9 268,97 $ → 7 687,17 $ avec un TTL d’1 heure (environ 17,1 % de dépense excédentaire)
    • Le même niveau de gaspillage apparaît de manière cohérente entre les modèles
  • Impact sur le quota

    • Les jetons de création de cache sont entièrement comptabilisés dans le quota, tandis que les lectures du cache sont calculées avec une pondération plus faible
    • Après mars, des abonnés ont commencé, pour la première fois, à atteindre la limite de quota sur 5 heures

Réponse officielle d’Anthropic

  • Reconnaissance du changement : la modification du 6 mars était intentionnelle et a été effectuée dans le cadre d’un travail d’optimisation du cache
    • Le système est conçu pour appliquer des TTL différents selon le type de requête, et il n’existe pas de valeur par défaut globale unique
    • Appliquer un TTL d’1 heure à toutes les requêtes pourrait au contraire augmenter les coûts
    • Un TTL de 5 minutes est plus efficace pour les requêtes qui ne sont pas réutilisées et, sur l’ensemble des combinaisons de requêtes, il permet de réduire le coût total
  • Correction de bug : dans la v2.1.90, correction d’un bug client qui forçait un TTL de 5 minutes jusqu’à la fin de la session lorsque tout le quota d’abonnement avait été consommé
  • Réponse aux demandes
    1. Il y a bien eu un changement, appliqué intentionnellement le 6 mars
    2. Le TTL est choisi dynamiquement selon chaque requête, sans valeur par défaut globale
    3. Aucun retour prévu à un TTL d’1 heure par défaut, ni d’option de configuration prévue
    4. Le mode de prise en compte des jetons de lecture du cache dans le quota fera l’objet d’un suivi séparé

Réaction de la communauté

  • De nombreux utilisateurs ont exprimé leur mécontentement en pointant une hausse des coûts et une dégradation de l’usage

    • Beaucoup estiment qu’« un TTL de 5 minutes revient en pratique à redémarrer la session toutes les 5 minutes, ce qui nuit à la productivité »
    • D’autres soulignent que « les abonnés ont déjà payé à l’avance, mais le changement de TTL a réduit leur temps d’usage effectif »
    • Des demandes se multiplient pour qu’« un changement ayant un impact sur le coût utilisateur fasse l’objet d’un préavis obligatoire »
  • Certains utilisateurs ont mentionné un effet positif pour les utilisateurs de l’API, mais d’autres ont rétorqué que « pour l’API, le TTL de 5 minutes était déjà la valeur par défaut »

  • Les critiques se concentrent sur le manque de transparence

    • « Les changements d’infrastructure liés aux coûts doivent être annoncés à l’avance, pas expliqués après coup »
    • « Ce type de “changement silencieux” érode la confiance et force les utilisateurs à remonter eux-mêmes à la cause du problème »
  • D’après la documentation, le cache par défaut utilise un TTL de 5 minutes, tandis que le TTL d’1 heure est proposé comme option entraînant un coût supplémentaire

    • La même explication figure également dans la documentation officielle en janvier 2026

Conclusion

  • Le 6 mars 2026, Anthropic a modifié la politique de TTL du cache de Claude Code de 1 heure à 5 minutes
  • L’entreprise l’a présenté comme un ajustement intentionnel d’optimisation des coûts, mais les utilisateurs dénoncent la hausse des coûts, l’épuisement du quota et le manque de transparence
  • La communauté demande désormais de garantir aux utilisateurs le choix du réglage du TTL et de prévenir à l’avance en cas de changement de politique

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.