- Claude Sonnet 4 d’Anthropic prend désormais en charge un contexte allant jusqu’à 1 million de tokens, ce qui permet de traiter en une seule fois de vastes bases de code ou de nombreux documents
- Grâce à cette prise en charge étendue du contexte, divers usages deviennent possibles, comme l’analyse de code à grande échelle, le traitement de vastes ensembles de documents et le développement d’agents capables de conserver le contexte
- Pour les prompts dépassant 200 000 tokens, les tarifs API augmentent, mais il est possible de réduire les coûts grâce au prompt caching et au traitement par lots
- Les clients Bolt.new et iGent AI ont déjà considérablement amélioré leur productivité et leurs fonctionnalités IA grâce à cette capacité
- La prise en charge du long contexte de Sonnet 4 est actuellement disponible en bêta sur l’API Anthropic et Amazon Bedrock, et sera bientôt proposée sur Google Cloud
Prise en charge d’un contexte de 1 million de tokens
- Claude Sonnet 4 via l’API Anthropic prend désormais en charge jusqu’à 1 million de tokens de contexte
- Cela permet de traiter en une seule requête l’intégralité de plus de 75 000 lignes de code ou plusieurs articles de recherche de façon unifiée
- La fonctionnalité bêta de contexte à 1 million de tokens est actuellement disponible sur l’API Anthropic et Amazon Bedrock, et Vertex AI de Google Cloud la prendra également bientôt en charge
Un contexte plus long, des cas d’usage élargis
- Analyse de code à grande échelle : il devient possible de charger en une seule fois l’ensemble d’une base de code (fichiers source, tests et documentation compris), afin de comprendre la structure du projet, d’identifier les relations entre les fichiers et de proposer des améliorations de code fondées sur l’architecture du système
- Synthèse unifiée de documents : il est possible d’analyser en bloc des centaines de contrats juridiques, d’articles de recherche ou de spécifications techniques, et d’en extraire des insights globaux tout en conservant les relations entre les documents
- Agents avec maintien du contexte : même au fil de centaines d’appels d’outils et de workflows multi-étapes, il devient possible de développer des agents conversationnels conservant un état cohérent en incluant l’ensemble de la documentation API, les définitions d’outils et l’historique des interactions
Politique tarifaire de l’API
- Prompts de 200 000 tokens ou moins : entrée à 3 $/million de tokens, sortie à 15 $/million de tokens
- Prompts de plus de 200 000 tokens : entrée à 6 $/million de tokens, sortie à 22,5 $/million de tokens
- L’application du prompt caching permet de réduire la latence et les coûts
- La combinaison du contexte à 1 million de tokens avec le traitement par lots peut permettre jusqu’à 50 % d’économies supplémentaires
Cas d’usage chez les clients
-
Bolt.new
- Bolt.new intègre Claude à une plateforme de développement web et fait évoluer en profondeur le développement web
- "Grâce à la fenêtre de contexte de 1 million de tokens de Sonnet 4, les développeurs peuvent désormais gérer des projets plus vastes avec une grande précision"
-
iGent AI
- Basée à Londres, au Royaume-Uni, iGent AI transforme le contenu des conversations en code exploitable via Maestro, son partenaire IA
- "Des capacités d’ingénierie logicielle autonome auparavant impossibles deviennent réalisables grâce au contexte de 1 million de tokens de Sonnet 4, ce qui permet de faire tourner des sessions durant plusieurs jours sur de véritables bases de code"
Utilisation et feuille de route
- La fonctionnalité de long contexte est actuellement proposée en bêta aux clients Tier 4 et aux clients avec tarification personnalisée de l’API Anthropic, avec un élargissement à davantage d’utilisateurs prévu dans les prochaines semaines
- Elle est également prise en charge sur Amazon Bedrock, et la prise en charge de Google Cloud Vertex AI est prévue prochainement
- Anthropic prévoit aussi d’introduire le long contexte dans d’autres produits de la gamme Claude
- Des informations détaillées sont disponibles dans la documentation officielle et la page des tarifs
Aucun commentaire pour le moment.