25 points par GN⁺ 2026-04-09 | 1 commentaires | Partager sur WhatsApp
  • Une suite d’API composable permettant de construire et déployer des agents à grande échelle dans le cloud, avec la possibilité de passer d’un prototype à la production en quelques jours
  • Gestion automatique d’une infrastructure de niveau production — sandboxing sécurisé, gestion des identifiants, contrôle des permissions — afin que les utilisateurs puissent se concentrer uniquement sur la définition des tâches
  • Prise en charge des sessions longue durée, de la collaboration multi-agents et d’une gouvernance fondée sur la confiance, avec une intégration étroite aux modèles Claude pour permettre des itérations autonomes et de meilleures performances
  • Des entreprises majeures comme Notion, Rakuten, Asana et Sentry l’utilisent déjà pour obtenir des déploiements 10 fois plus rapides et des workflows automatisés
  • Proposé avec une facturation à l’usage, c’est une plateforme qui améliore en profondeur l’efficacité opérationnelle et la productivité de développement des organisations

Présentation de Claude Managed Agents

  • Claude Managed Agents est une suite d’API composable proposée en bêta publique pour construire et déployer des agents à grande échelle dans le cloud
  • Jusqu’ici, le développement d’agents demandait souvent plusieurs mois en raison de l’infrastructure de sécurité, de la gestion d’état, du contrôle des permissions et de l’adaptation aux mises à niveau des modèles ; Managed Agents permet au contraire de passer du prototype à la production en quelques jours
  • La solution couvre aussi bien l’exécution d’une tâche unique que des pipelines complexes multi-agents, et permet aux utilisateurs de se concentrer sur l’expérience utilisateur sans surcharge opérationnelle

Construire et déployer des agents 10 fois plus vite

  • Déployer un agent au niveau production exige du sandboxing pour l’exécution de code, des checkpoints, la gestion des identifiants, la définition du périmètre des permissions et une traçabilité de bout en bout
  • Managed Agents prend en charge cette complexité, et l’utilisateur n’a plus qu’à définir les tâches, les outils et les garde-fous
  • Un harnais d’orchestration intégré gère automatiquement le moment des appels d’outils, la gestion du contexte et la reprise sur erreur
  • Fonctions principales :
    • Agents de niveau production : sandboxing sécurisé, authentification et exécution des outils gérés automatiquement
    • Sessions longue durée : fonctionnement autonome pendant plusieurs heures, avec conservation de la progression et des sorties même en cas de coupure de connexion
    • Collaboration multi-agents : création et pilotage d’autres agents pour paralléliser des tâches complexes (au stade research preview)
    • Gouvernance fondée sur la confiance : périmètre des permissions, gestion des identités et traçabilité de l’exécution intégrés

Une conception intégrée aux modèles Claude

  • Les modèles Claude sont optimisés pour les tâches centrées sur les agents, et Managed Agents est conçu pour en tirer pleinement parti
  • L’utilisateur n’a qu’à définir le résultat attendu et les critères de réussite, puis Claude s’autoévalue et itère de manière autonome pour atteindre l’objectif (disponible en research preview)
  • Si nécessaire, les workflows classiques de type prompt-réponse restent également pris en charge
  • Lors de tests internes sur des tâches structurées de génération de fichiers, les performances ont progressé jusqu’à 10 points par rapport à une boucle de prompts standard
  • Le suivi de session, l’analyse unifiée et les guides de résolution de problèmes sont intégrés à Claude Console, ce qui permet d’examiner tous les appels d’outils et processus de décision

Cas d’usage concrets

  • Diverses équipes ont obtenu des déploiements en production 10 fois plus rapides grâce à Managed Agents
    • Agents de codage : analyse du codebase, élaboration d’un plan de correction, création de PR
    • Agents de productivité : participation aux projets, exécution des tâches, livraison des résultats
    • Agents finance et juridique : traitement de documents et extraction des informations clés
  • Exemples d’entreprises :
    • Notion

      • Exploite une version alpha de Custom Agents, qui permet de déléguer directement des tâches à Claude depuis l’espace de travail
      • Les ingénieurs peuvent déployer du code, et les travailleurs du savoir réaliser en parallèle des dizaines de tâches comme la création de sites web ou de présentations
    • Rakuten

      • A déployé des agents d’entreprise intégrés à Slack et Teams pour les équipes produit, commerciales, marketing, finance et RH
      • Chaque agent spécialisé a été déployé en moins d’une semaine
    • Asana

      • Intègre dans les projets des agents collaborant avec les humains via AI Teammates
      • A mis en œuvre des fonctionnalités avancées en quelques semaines grâce à Managed Agents
    • Vibecode

      • A construit avec Managed Agents une infrastructure d’apps native IA reliant le prompt jusqu’au déploiement de l’application
      • La même infrastructure peut être mise en place 10 fois plus vite
    • Sentry

      • Combine l’agent de débogage Seer et un agent de rédaction de correctifs basé sur Claude
      • A automatisé dans un flux unique tout le processus, de la détection du bug à la création de PR, en achevant en quelques semaines une intégration qui prenait auparavant plusieurs mois

Citations clients

  • Ansh Nanda (cofondateur) : auparavant, il fallait gérer manuellement les LLM dans des sandboxes ; désormais, quelques lignes de code suffisent pour construire une infrastructure 10 fois plus vite, avec à la clé une explosion attendue des apps natives IA
  • Indragie Karunaratne (director of AI/ML engineering, Sentry) : Managed Agents fournit un runtime sécurisé et entièrement managé, améliorant l’expérience développeur tout en supprimant la charge opérationnelle
  • Sanchan Saxena (responsable produit, Atlassian) : l’intégration d’agents dans les workflows Jira, avec automatisation du sandboxing, des sessions et de la gestion des permissions, améliore l’efficacité de l’ingénierie
  • Javed Qadrud-Din (CTO) : Managed Agents génère à la volée les outils nécessaires pour répondre à toutes les requêtes des utilisateurs, réduisant par 10 le temps de développement
  • John Han (cofondateur) : un agent de préparation de réunion a été mis en production en quelques jours, avec connexion automatique aux systèmes externes et recherche web
  • Eric Liu (PM, Notion) : les sessions longue durée et la gestion de la mémoire permettent de déléguer des tâches complexes et ouvertes
  • Yusuke Kaji (responsable IA, Rakuten) : des agents spécialisés pour chaque département ont été déployés en moins d’une semaine, permettant une montée en charge sûre et une démocratisation de l’innovation
  • Amritansh Raghav (CTO, Asana) : la vitesse de développement d’AI Teammates a été fortement accélérée, renforçant l’expérience collaborative de niveau entreprise

Pour commencer

  • Managed Agents utilise une tarification à l’usage, avec un supplément de 0,08 $ par heure de session en plus du tarif standard par jeton de Claude Platform
  • Les détails de tarification sont disponibles dans la documentation officielle
  • Il est possible de déployer son premier agent via Claude Console ou le CLI, avec prise en charge de l’intégration avec Claude Code et la compétence claude-api
  • L’onboarding peut être lancé avec la commande “start onboarding for managed agents in Claude API”

Transformer les opérations des organisations

  • Managed Agents est un outil capable de transformer en profondeur la façon dont les organisations opèrent,
    en aidant les développeurs et les équipes à se concentrer sur la productivité et l’expérience utilisateur plutôt que sur l’infrastructure
  • Des mises à jour continues et un élargissement de la communauté sont prévus via Claude Platform

1 commentaires

 
GN⁺ 2026-04-09
Réactions sur Hacker News
  • Je soupçonne que cela va mener à la meilleure orchestration possible
    L’open source pourrait ne pas proposer une meilleure alternative à temps
    Jusqu’ici, les meilleures performances sont apparues quand on mélangeait des agents de plusieurs entreprises
    Plus important que le « planner », il y a le « worker ». Certains agents sont bien meilleurs sur des tâches précises
    Par exemple, Opus 4.6 n’est même pas comparable à GPT 5.4 xhigh pour la détection de bugs
    Comme dans le monde réel où la diversité des façons de penser renforce la robustesse d’une équipe, un mélange d’agents produit un effet similaire

    • Pour qu’Anthropic crée la meilleure version, il faudrait qu’ils battent toutes les autres entreprises d’IA sur chaque sous-tâche (documentation technique, diagrammes, détection de bugs, etc.)
      Mais ils ne laisseront probablement jamais appeler des modèles externes comme Codex dans leur stack
    • Ce qui m’inquiète, c’est que cela puisse déboucher sur un langage d’orchestration optimal
      Par exemple, et si Claude transformait toutes les communications entre agents en sumérien ?
      Une entreprise donnée pourrait alors monopoliser l’expertise sur ce langage
    • Moi aussi, j’obtenais les meilleurs résultats en mélangeant des modèles de plusieurs entreprises
      Rédiger les specs avec Opus → corriger avec Gemini → repasser par Opus pour le feedback → je relis → build avec Qwen3.5 → review avec Opus
      Ce flux était parfait, puis Anthropic a changé sa politique et l’a cassé
    • En ce moment, les entreprises d’IA ressemblent à des homards dans un seau
      Quand l’une sort un modèle fermé, les autres l’analysent, l’améliorent et publient le résultat en open source
      À force de se tirer mutuellement vers le bas, cela pourrait finir par ressembler à un cartel
  • On voit bien qu’Anthropic cherche à attirer les développeurs sur sa plateforme
    Pour l’IPO, il faut devenir une entreprise de plateforme, pas juste un fournisseur de modèles
    Tous leurs mouvements actuels pointent dans cette direction

  • J’utilise Claude Code tous les jours, mais rendre les systèmes clients dépendants d’Anthropic est risqué
    Le quality engineering n’est pas leur point fort. Et un niveau de disponibilité à « single 9 » serait problématique

  • Nous sommes encore aux débuts des frameworks d’agents, un peu comme le web avant PHP
    Chaque semaine apporte de nouveaux patterns et de nouveaux modèles, ce qui force tous les frameworks à se réinventer
    LangChain essaie de devenir l’équivalent de Next.js/Vercel, mais la plupart recommandent encore de tout construire soi-même
    Anthropic, comme ils possèdent directement les modèles, captera une certaine demande avec une solution à faible barrière d’entrée, mais le lock-in et la vitesse du changement technique restent des problèmes

    • Je suis d’accord. On est encore dans la période où des centaines de solutions à moitié finies flottent sur les blogs et GitHub
      LangChain est ce qui s’en rapproche le plus, mais ça garde encore un fort côté DIY
      Et tout le monde mélange des vector DB et des modèles de reranking différents
  • J’étais en train de construire quelque chose de similaire moi-même, donc j’ai été surpris de voir qu’Anthropic suivait une idée parallèle
    Il faut absolument éviter d’être lié à un seul fournisseur de modèles
    Pour une petite équipe, ça peut aller, mais dans un système complexe, c’est suicidaire
    Il faut comparer et combiner plusieurs modèles, puis les piloter selon son propre style. Comme en cuisine, il faut choisir des saveurs différentes selon la situation

    • En réalité, tout le monde construit à peu près la même chose. Les directions possibles sont limitées
    • Je me demande si la raison d’éviter le lock-in est simplement la performance, ou si c’est aussi parce qu’Anthropic pourrait utiliser les données de télémétrie pour devenir plus tard un concurrent
    • Je suis du même avis. Il est assez simple de monter ce genre de système au-dessus d’une plateforme d’agrégation comme openrouter
  • La page générée par ces agents était tellement bancale que le texte des témoignages se chevauchait, au point de devenir illisible

    • Moi, je n’ai vu qu’un écran noir
  • Je fais tourner un conteneur Docker qui crée un site Jekyll avec l’Anthropic Agentic SDK
    Mettre l’infrastructure en place n’a pas été difficile ; la vraie difficulté, c’était de faire en sorte que l’agent se comporte comme je le voulais
    Je pourrais un jour migrer vers un autre fournisseur ou vers du self-hosting, donc je veux garder ma liberté

  • Moi, je vais continuer à utiliser la combinaison pydantic ai et dbos/temporal/celery
    Je ne veux pas être lié à un fournisseur précis. Je veux pouvoir utiliser n’importe quel LLM librement
    Il faut continuer à pousser le développement de l’orchestration open source

  • En apparence c’est impressionnant, mais cela pourrait aussi devenir une bombe de coûts
    Comme avec AWS, si on manque de vigilance, des milliers d’agents tourneront et la facture explosera
    Cela ressemble à un énorme modèle de revenus pour Anthropic

  • Cette direction était prévisible
    C’est un moyen facile d’augmenter les revenus et de renforcer le lock-in utilisateur sans rendre les modèles plus intelligents
    L’analyse liée à ce sujet est bien résumée dans cet article