- Activé par défaut : pour les utilisateurs Max, Team et Enterprise, le contexte 1M est automatiquement activé dans Opus 4.6
- Sans surcoût : une requête de 900K tokens est facturée au même prix par token qu'une requête de 9K
- Aucune limite de débit supplémentaire : même avec un contexte plus long, les limites de débit ne sont pas réduites et le débit du compte reste inchangé
- Aucun envoi de beta header nécessaire : les requêtes dépassant 200K fonctionnent automatiquement, sans modification du code existant
6 commentaires
C’est sûr qu’avec 1M, la compaction se déclenche beaucoup moins souvent, c’est appréciable.
gpt5.4 et opus 4.6, ce n’est pas terrible de les pousser tous les deux jusqu’à 1M jusqu’au bout… J’ai l’impression qu’il vaut mieux couper vers 700~800k.
C’est bien..
« Sans frais supplémentaires »
En contrepartie, l’option 200K a disparu.
Il semble qu’il soit possible de se désinscrire avec l’option
CLAUDE_CODE_DISABLE_1M_CONTEXT.Consultez https://code.claude.com/docs/en/env-vars !