Anthropic lance Claude 4

(anthropic.com)

19 points par humblebee 2025-05-23 | 2 commentaires | Partager sur WhatsApp

Anthropic a lancé la série Claude 4 le 23 mai 2025. Les modèles annoncés, Claude Opus 4 et Claude Sonnet 4, améliorent les capacités de codage et d’exécution de tâches de longue durée par rapport aux versions précédentes, tout en conservant les mêmes tarifs.

Capacité de travail soutenu
- 7 heures de travail continu : dans un refactoring open source validé par Rakuten, le modèle a travaillé de manière autonome pendant 7 heures
- Peut traiter sans interruption des tâches complexes comportant des milliers d’étapes
- Une endurance nettement supérieure aux limites des agents IA existants
Système de mémoire amélioré
- Génère automatiquement des fichiers mémoire comme Navigation Guide pour mieux comprendre le contexte des travaux de longue durée
- Utilisation pratique de la mémoire, par exemple en rédigeant lui-même un guide de navigation pendant une partie de Pokémon
- Réduction de 65 % des comportements consistant à utiliser des raccourcis ou à exploiter des failles par rapport au modèle précédent
Modèle de raisonnement hybride
- Mode de réponse immédiate : pour les cas où une réponse rapide est nécessaire
- Mode de réflexion étendue : permet un raisonnement approfondi jusqu’à 64K tokens
- Bascule automatiquement entre les deux modes selon la situation
Utilisation d’outils
- Exécution parallèle d’outils : utilisation simultanée de plusieurs outils pour gagner en efficacité
- Utilisation d’outils pendant la réflexion : recours à la recherche web, entre autres, pendant le raisonnement pour produire des réponses plus précises
Amélioration de la qualité du code
- Évaluation de Block : « le premier modèle à avoir amélioré la qualité du code pendant l’édition et le débogage »
- Rapport d’iGent : le taux d’erreur dans l’exploration de codebases est passé de 20 % à presque 0 %
- Sourcegraph : une qualité de code plus élégante et une compréhension plus profonde des problèmes
Intégration de Claude Code dans les workflows métier
- Intégration directe à l’IDE : les modifications de code s’affichent directement dans l’éditeur
- Gestion des GitHub PR : traitement automatique des retours des reviewers de PR et correction des erreurs de CI
- Tâches en arrière-plan : prise en charge de l’automatisation via GitHub Actions
- SDK extensible : permet aux développeurs de créer leurs propres agents
Nouvelles fonctionnalités API
- Outil d’exécution de code
- Connecteur MCP
- Files API
- Cache de prompt jusqu’à 1 heure
Sécurité
- Mise en œuvre de protections ASL-3 (AI Safety Level 3)
- Capacité plus fine à suivre les instructions
- Comportement plus responsable réduisant les risques d’abus

2 commentaires

humblebee 2025-05-23

Il est écrit qu’il a effectué du refactoring sans interruption pendant 7 heures ; si la qualité est au rendez-vous, on peut même imaginer un niveau de prestation externalisée haut de gamme qu’un développeur lui confie en partant du bureau, puis révise le lendemain 😂

sinbumu 2025-05-23

Ils ont bien identifié ce point, donc des acteurs comme Google testent déjà en version bêta, à titre expérimental, des agents de code comme Jules... Tu confies une tâche à l’IA, et au lieu de travailler en local, elle se débrouille toute seule dans un environnement cloud, puis plus tard il te suffit de vérifier le résultat et de lui faire valider le commit, le déploiement, etc.

Anthropic lance Claude 4

À lire aussi

2 commentaires