Anthropic lance Claude 4
(anthropic.com)Anthropic a lancé la série Claude 4 le 23 mai 2025. Les modèles annoncés, Claude Opus 4 et Claude Sonnet 4, améliorent les capacités de codage et d’exécution de tâches de longue durée par rapport aux versions précédentes, tout en conservant les mêmes tarifs.
-
Capacité de travail soutenu
- 7 heures de travail continu : dans un refactoring open source validé par Rakuten, le modèle a travaillé de manière autonome pendant 7 heures
- Peut traiter sans interruption des tâches complexes comportant des milliers d’étapes
- Une endurance nettement supérieure aux limites des agents IA existants
-
Système de mémoire amélioré
- Génère automatiquement des fichiers mémoire comme
Navigation Guidepour mieux comprendre le contexte des travaux de longue durée - Utilisation pratique de la mémoire, par exemple en rédigeant lui-même un guide de navigation pendant une partie de Pokémon
- Réduction de 65 % des comportements consistant à utiliser des raccourcis ou à exploiter des failles par rapport au modèle précédent
- Génère automatiquement des fichiers mémoire comme
-
Modèle de raisonnement hybride
- Mode de réponse immédiate : pour les cas où une réponse rapide est nécessaire
- Mode de réflexion étendue : permet un raisonnement approfondi jusqu’à 64K tokens
- Bascule automatiquement entre les deux modes selon la situation
-
Utilisation d’outils
- Exécution parallèle d’outils : utilisation simultanée de plusieurs outils pour gagner en efficacité
- Utilisation d’outils pendant la réflexion : recours à la recherche web, entre autres, pendant le raisonnement pour produire des réponses plus précises
-
Amélioration de la qualité du code
- Évaluation de Block : « le premier modèle à avoir amélioré la qualité du code pendant l’édition et le débogage »
- Rapport d’iGent : le taux d’erreur dans l’exploration de codebases est passé de 20 % à presque 0 %
- Sourcegraph : une qualité de code plus élégante et une compréhension plus profonde des problèmes
-
Intégration de Claude Code dans les workflows métier
- Intégration directe à l’IDE : les modifications de code s’affichent directement dans l’éditeur
- Gestion des GitHub PR : traitement automatique des retours des reviewers de PR et correction des erreurs de CI
- Tâches en arrière-plan : prise en charge de l’automatisation via GitHub Actions
- SDK extensible : permet aux développeurs de créer leurs propres agents
-
Nouvelles fonctionnalités API
- Outil d’exécution de code
- Connecteur MCP
- Files API
- Cache de prompt jusqu’à 1 heure
-
Sécurité
- Mise en œuvre de protections ASL-3 (AI Safety Level 3)
- Capacité plus fine à suivre les instructions
- Comportement plus responsable réduisant les risques d’abus
2 commentaires
Il est écrit qu’il a effectué du refactoring sans interruption pendant 7 heures ; si la qualité est au rendez-vous, on peut même imaginer un niveau de prestation externalisée haut de gamme qu’un développeur lui confie en partant du bureau, puis révise le lendemain 😂
Ils ont bien identifié ce point, donc des acteurs comme Google testent déjà en version bêta, à titre expérimental, des agents de code comme Jules... Tu confies une tâche à l’IA, et au lieu de travailler en local, elle se débrouille toute seule dans un environnement cloud, puis plus tard il te suffit de vérifier le résultat et de lui faire valider le commit, le déploiement, etc.