- Une suite d’API composable permettant de construire et déployer des agents à grande échelle dans le cloud, avec la possibilité de passer d’un prototype à la production en quelques jours
- Gestion automatique d’une infrastructure de niveau production — sandboxing sécurisé, gestion des identifiants, contrôle des permissions — afin que les utilisateurs puissent se concentrer uniquement sur la définition des tâches
- Prise en charge des sessions longue durée, de la collaboration multi-agents et d’une gouvernance fondée sur la confiance, avec une intégration étroite aux modèles Claude pour permettre des itérations autonomes et de meilleures performances
- Des entreprises majeures comme Notion, Rakuten, Asana et Sentry l’utilisent déjà pour obtenir des déploiements 10 fois plus rapides et des workflows automatisés
- Proposé avec une facturation à l’usage, c’est une plateforme qui améliore en profondeur l’efficacité opérationnelle et la productivité de développement des organisations
Présentation de Claude Managed Agents
- Claude Managed Agents est une suite d’API composable proposée en bêta publique pour construire et déployer des agents à grande échelle dans le cloud
- Jusqu’ici, le développement d’agents demandait souvent plusieurs mois en raison de l’infrastructure de sécurité, de la gestion d’état, du contrôle des permissions et de l’adaptation aux mises à niveau des modèles ; Managed Agents permet au contraire de passer du prototype à la production en quelques jours
- La solution couvre aussi bien l’exécution d’une tâche unique que des pipelines complexes multi-agents, et permet aux utilisateurs de se concentrer sur l’expérience utilisateur sans surcharge opérationnelle
Construire et déployer des agents 10 fois plus vite
- Déployer un agent au niveau production exige du sandboxing pour l’exécution de code, des checkpoints, la gestion des identifiants, la définition du périmètre des permissions et une traçabilité de bout en bout
- Managed Agents prend en charge cette complexité, et l’utilisateur n’a plus qu’à définir les tâches, les outils et les garde-fous
- Un harnais d’orchestration intégré gère automatiquement le moment des appels d’outils, la gestion du contexte et la reprise sur erreur
- Fonctions principales :
- Agents de niveau production : sandboxing sécurisé, authentification et exécution des outils gérés automatiquement
- Sessions longue durée : fonctionnement autonome pendant plusieurs heures, avec conservation de la progression et des sorties même en cas de coupure de connexion
- Collaboration multi-agents : création et pilotage d’autres agents pour paralléliser des tâches complexes (au stade research preview)
- Gouvernance fondée sur la confiance : périmètre des permissions, gestion des identités et traçabilité de l’exécution intégrés
Une conception intégrée aux modèles Claude
- Les modèles Claude sont optimisés pour les tâches centrées sur les agents, et Managed Agents est conçu pour en tirer pleinement parti
- L’utilisateur n’a qu’à définir le résultat attendu et les critères de réussite, puis Claude s’autoévalue et itère de manière autonome pour atteindre l’objectif (disponible en research preview)
- Si nécessaire, les workflows classiques de type prompt-réponse restent également pris en charge
- Lors de tests internes sur des tâches structurées de génération de fichiers, les performances ont progressé jusqu’à 10 points par rapport à une boucle de prompts standard
- Le suivi de session, l’analyse unifiée et les guides de résolution de problèmes sont intégrés à Claude Console, ce qui permet d’examiner tous les appels d’outils et processus de décision
Cas d’usage concrets
- Diverses équipes ont obtenu des déploiements en production 10 fois plus rapides grâce à Managed Agents
- Agents de codage : analyse du codebase, élaboration d’un plan de correction, création de PR
- Agents de productivité : participation aux projets, exécution des tâches, livraison des résultats
- Agents finance et juridique : traitement de documents et extraction des informations clés
- Exemples d’entreprises :
-
Notion
- Exploite une version alpha de Custom Agents, qui permet de déléguer directement des tâches à Claude depuis l’espace de travail
- Les ingénieurs peuvent déployer du code, et les travailleurs du savoir réaliser en parallèle des dizaines de tâches comme la création de sites web ou de présentations
-
Rakuten
- A déployé des agents d’entreprise intégrés à Slack et Teams pour les équipes produit, commerciales, marketing, finance et RH
- Chaque agent spécialisé a été déployé en moins d’une semaine
-
Asana
- Intègre dans les projets des agents collaborant avec les humains via AI Teammates
- A mis en œuvre des fonctionnalités avancées en quelques semaines grâce à Managed Agents
-
Vibecode
- A construit avec Managed Agents une infrastructure d’apps native IA reliant le prompt jusqu’au déploiement de l’application
- La même infrastructure peut être mise en place 10 fois plus vite
-
Sentry
- Combine l’agent de débogage Seer et un agent de rédaction de correctifs basé sur Claude
- A automatisé dans un flux unique tout le processus, de la détection du bug à la création de PR, en achevant en quelques semaines une intégration qui prenait auparavant plusieurs mois
-
Citations clients
- Ansh Nanda (cofondateur) : auparavant, il fallait gérer manuellement les LLM dans des sandboxes ; désormais, quelques lignes de code suffisent pour construire une infrastructure 10 fois plus vite, avec à la clé une explosion attendue des apps natives IA
- Indragie Karunaratne (director of AI/ML engineering, Sentry) : Managed Agents fournit un runtime sécurisé et entièrement managé, améliorant l’expérience développeur tout en supprimant la charge opérationnelle
- Sanchan Saxena (responsable produit, Atlassian) : l’intégration d’agents dans les workflows Jira, avec automatisation du sandboxing, des sessions et de la gestion des permissions, améliore l’efficacité de l’ingénierie
- Javed Qadrud-Din (CTO) : Managed Agents génère à la volée les outils nécessaires pour répondre à toutes les requêtes des utilisateurs, réduisant par 10 le temps de développement
- John Han (cofondateur) : un agent de préparation de réunion a été mis en production en quelques jours, avec connexion automatique aux systèmes externes et recherche web
- Eric Liu (PM, Notion) : les sessions longue durée et la gestion de la mémoire permettent de déléguer des tâches complexes et ouvertes
- Yusuke Kaji (responsable IA, Rakuten) : des agents spécialisés pour chaque département ont été déployés en moins d’une semaine, permettant une montée en charge sûre et une démocratisation de l’innovation
- Amritansh Raghav (CTO, Asana) : la vitesse de développement d’AI Teammates a été fortement accélérée, renforçant l’expérience collaborative de niveau entreprise
Pour commencer
- Managed Agents utilise une tarification à l’usage, avec un supplément de 0,08 $ par heure de session en plus du tarif standard par jeton de Claude Platform
- Les détails de tarification sont disponibles dans la documentation officielle
- Il est possible de déployer son premier agent via Claude Console ou le CLI, avec prise en charge de l’intégration avec Claude Code et la compétence claude-api
- L’onboarding peut être lancé avec la commande “start onboarding for managed agents in Claude API”
Transformer les opérations des organisations
- Managed Agents est un outil capable de transformer en profondeur la façon dont les organisations opèrent,
en aidant les développeurs et les équipes à se concentrer sur la productivité et l’expérience utilisateur plutôt que sur l’infrastructure - Des mises à jour continues et un élargissement de la communauté sont prévus via Claude Platform
1 commentaires
Réactions sur Hacker News
Je soupçonne que cela va mener à la meilleure orchestration possible
L’open source pourrait ne pas proposer une meilleure alternative à temps
Jusqu’ici, les meilleures performances sont apparues quand on mélangeait des agents de plusieurs entreprises
Plus important que le « planner », il y a le « worker ». Certains agents sont bien meilleurs sur des tâches précises
Par exemple, Opus 4.6 n’est même pas comparable à GPT 5.4 xhigh pour la détection de bugs
Comme dans le monde réel où la diversité des façons de penser renforce la robustesse d’une équipe, un mélange d’agents produit un effet similaire
Mais ils ne laisseront probablement jamais appeler des modèles externes comme Codex dans leur stack
Par exemple, et si Claude transformait toutes les communications entre agents en sumérien ?
Une entreprise donnée pourrait alors monopoliser l’expertise sur ce langage
Rédiger les specs avec Opus → corriger avec Gemini → repasser par Opus pour le feedback → je relis → build avec Qwen3.5 → review avec Opus
Ce flux était parfait, puis Anthropic a changé sa politique et l’a cassé
Quand l’une sort un modèle fermé, les autres l’analysent, l’améliorent et publient le résultat en open source
À force de se tirer mutuellement vers le bas, cela pourrait finir par ressembler à un cartel
On voit bien qu’Anthropic cherche à attirer les développeurs sur sa plateforme
Pour l’IPO, il faut devenir une entreprise de plateforme, pas juste un fournisseur de modèles
Tous leurs mouvements actuels pointent dans cette direction
J’utilise Claude Code tous les jours, mais rendre les systèmes clients dépendants d’Anthropic est risqué
Le quality engineering n’est pas leur point fort. Et un niveau de disponibilité à « single 9 » serait problématique
Nous sommes encore aux débuts des frameworks d’agents, un peu comme le web avant PHP
Chaque semaine apporte de nouveaux patterns et de nouveaux modèles, ce qui force tous les frameworks à se réinventer
LangChain essaie de devenir l’équivalent de Next.js/Vercel, mais la plupart recommandent encore de tout construire soi-même
Anthropic, comme ils possèdent directement les modèles, captera une certaine demande avec une solution à faible barrière d’entrée, mais le lock-in et la vitesse du changement technique restent des problèmes
LangChain est ce qui s’en rapproche le plus, mais ça garde encore un fort côté DIY
Et tout le monde mélange des vector DB et des modèles de reranking différents
J’étais en train de construire quelque chose de similaire moi-même, donc j’ai été surpris de voir qu’Anthropic suivait une idée parallèle
Il faut absolument éviter d’être lié à un seul fournisseur de modèles
Pour une petite équipe, ça peut aller, mais dans un système complexe, c’est suicidaire
Il faut comparer et combiner plusieurs modèles, puis les piloter selon son propre style. Comme en cuisine, il faut choisir des saveurs différentes selon la situation
La page générée par ces agents était tellement bancale que le texte des témoignages se chevauchait, au point de devenir illisible
Je fais tourner un conteneur Docker qui crée un site Jekyll avec l’Anthropic Agentic SDK
Mettre l’infrastructure en place n’a pas été difficile ; la vraie difficulté, c’était de faire en sorte que l’agent se comporte comme je le voulais
Je pourrais un jour migrer vers un autre fournisseur ou vers du self-hosting, donc je veux garder ma liberté
Moi, je vais continuer à utiliser la combinaison pydantic ai et dbos/temporal/celery
Je ne veux pas être lié à un fournisseur précis. Je veux pouvoir utiliser n’importe quel LLM librement
Il faut continuer à pousser le développement de l’orchestration open source
En apparence c’est impressionnant, mais cela pourrait aussi devenir une bombe de coûts
Comme avec AWS, si on manque de vigilance, des milliers d’agents tourneront et la facture explosera
Cela ressemble à un énorme modèle de revenus pour Anthropic
Cette direction était prévisible
C’est un moyen facile d’augmenter les revenus et de renforcer le lock-in utilisateur sans rendre les modèles plus intelligents
L’analyse liée à ce sujet est bien résumée dans cet article