Présentation de Swarms, la nouvelle fonctionnalité cachée de Claude Code, un mode d’équipe multi-agents

(twitter.com/NicerInPerson)

15 points par GN⁺ 2026-01-25 | 1 commentaires | Partager sur WhatsApp

Swarms est une fonctionnalité d’orchestration multi-agents présente dans Claude Code mais qui n’avait pas été rendue publique
L’utilisateur ne dialogue plus avec un seul codeur IA, mais interagit avec une IA jouant le rôle de chef d’équipe
Le chef d’équipe n’écrit pas directement le code : il établit le plan, répartit les tâches et synthétise les résultats, puis attribue les rôles aux agents subordonnés
Une fois le plan approuvé, des agents travailleurs spécialisés s’exécutent en parallèle et prennent en charge l’implémentation réelle
Cela montre que Claude Code évolue au-delà d’un simple outil vers un processus de développement à l’échelle d’une équipe

Fonctionnement

Lorsque l’utilisateur approuve le plan, le système bascule en Delegation Mode
Plusieurs agents travailleurs spécialisés sont créés et travaillent en parallèle
Chaque travailleur prend en charge des tâches d’implémentation concrètes comme l’écriture, l’analyse ou la modification de code
Les messages échangés entre les travailleurs servent à coordonner l’avancement et les dépendances
Tous les résultats sont agrégés par le chef d’équipe puis renvoyés sous forme de réponse finale

Outil `claude-sneakpeek`

Le dépôt claude-sneakpeek propose un build parallèle avec les feature flags de Claude Code activés
Il permet d’essayer des fonctionnalités non publiées, dont le mode Swarms, dans un environnement totalement séparé d’une installation existante de Claude Code
- Utilise une configuration, des sessions, des serveurs MCP et des identifiants d’authentification distincts
Il fournit des fonctions supplémentaires intégrées à Claude Code mais pas encore publiées
- Prise en charge de l’exécution multi-agents native via le Swarm mode
- Création d’agents en arrière-plan via le Delegate mode
- Fonctions de messagerie entre membres de l’équipe et de gestion de l’attribution des tâches
Prise en charge de modèles et fournisseurs supplémentaires
- Prend en charge Z.ai, MiniMax et OpenRouter, avec possibilité de connecter des modèles locaux via cc-mirror

1 commentaires

GN⁺ 2026-01-25

Réactions sur Hacker News

Honnêtement, ça peut sembler complètement dingue, mais c’est comme ça que j’ai obtenu le code de la plus haute qualité
Ça a coûté environ 10 fois plus cher, mais j’ai fait gérer toute une « équipe projet » avec plusieurs sous-agents par une seule instance d’Opus
La tâche consistait à porter un serveur Java legacy vers C# .NET 10, avec 9 agents, un Kanban en 7 étapes et une structure Git Worktree séparée
Les rôles étaient les suivants —
Manager (Claude Opus 4.5) : boucle d’événements globale qui réveille les agents selon l’état du Kanban
Product Owner (Claude Opus 4.5) : responsable de la stratégie, chargé d’éviter le scope creep
Scrum Master (Opus 4.5) : priorisation du backlog et attribution des tickets
Architecte (Sonnet 4.5) : uniquement la conception, pas l’implémentation
Archéologue (Grok-Free) : lit la décompilation du Java legacy uniquement quand c’est nécessaire
CAB (Opus 4.5) : gardien qui rejette des fonctionnalités aux étapes design et code
Binôme Dev (Sonnet 4.5 + Haiku 4.5) : boucle AD-TDD, le junior écrit les tests en échec, le senior corrige
Bibliothécaire (Gemini 2.5) : gestion de la documentation et déclenchement des rétrospectives
Franchement, à la question « est-ce vraiment nécessaire ? », la réponse est probablement « non », mais c’était trop amusant de voir des agents IA collaborer
La première version du processus est visible sur cette image
- Je me demande si tu pourrais partager des détails techniques
  J’aimerais savoir si c’est purement basé sur des prompts, un plugin, ou une structure de rappels via script
  Je me demande aussi où réside le Kanban
- J’utilise une structure assez proche moi aussi
  Avec un coordinateur et quelques agents spécialisés comme des experts backend, frontend et base de données
  La clé, c’est le coordinateur. Il réduit ma charge cognitive et suit très bien l’avancement global
- En général, un Scrum Master n’assigne pas directement les tickets
- Je pense que la prochaine étape, c’est de transformer ce que tu as construit en service
  Un peu dans l’idée de « je ne veux pas parler aux singes, je veux parler à l’organiste » : au début, on ferait des entretiens avec le manager et le program manager, puis ils avanceraient seuls et on ne demanderait plus que des démos et des mises à jour. C’est drôle
- Je me demande si c’est de la satire ou si c’est sincère
En fait, ça exploite simplement la fonction de sous-agent intégrée à Claude
Pas besoin de créer en Go une sorte d’abstraction tmux de 300 000 lignes
Il suffit de demander à Claude de lancer du travail en parallèle avec des sous-agents en arrière-plan
C’est utile d’avoir des fichiers pour transmettre les prompts, suivre l’avancement et faire du reporting, et je recommande de limiter chaque agent à un worktree séparé
Je documente ce pattern sur workforest.space
La plupart des gens construisent un orchestrateur séparé, alors qu’en réalité Claude lui-même est le meilleur orchestrateur
- Ce n’est pas un simple sous-agent
  La différence avec les outils existants, c’est qu’on passe d’une abstraction par conversation à une abstraction par tâche
  Claude Code était jusqu’ici limité par les apps tierces et leur approche centrée sur la conversation, mais Claude Code Web est le premier à étendre ça
  Cette approche laisse l’IA coordonner elle-même le travail, sans que l’utilisateur ait besoin d’envoyer des prompts en continu
  C’est complexe, mais on évolue vers une structure où une IA en gère d’autres
- En réalité, ce n’est pas une nouvelle fonctionnalité, mais plutôt une mise en application des sous-agents que Claude Code possédait déjà
  Cela dit, les détails de planification restent insuffisants, donc la fiabilité est encore limitée
- C’est différent des sous-agents existants
  L’agent principal passe dans un mode de contexte centré sur la délégation, avec intégration d’un système de tâches en équipe et d’un système de boîtes aux lettres
  C’est un niveau d’intégration qu’on ne peut pas obtenir avec un plugin
- La visualisation des « stacked PR » m’a permis de comprendre le concept immédiatement
  J’empile mes commits comme des PR puis je remets de l’ordre avec du rebase, et c’était assez pénible
  Maintenant, j’ai l’impression que je peux améliorer ça en répartissant le travail sur 2 ou 3 branches et en gérant les conflits au minimum
- Moi aussi, je garde l’instance Claude principale dans un rôle de manager, pour superviser les agents d’implémentation
  Ça aide à garder un contexte propre tout en obtenant des résultats de haute qualité
J’aimerais que le code évolue vers quelque chose de plus court et de meilleure qualité
Mais j’ai l’impression que la tendance actuelle va dans le sens inverse
Quand les modèles seront plus robustes, avec plus de bon sens et de meilleures boucles de feedback, ce sera utile, mais pour l’instant ça aggrave plutôt le problème avec une logique du type « plus il y a de code, mieux c’est »
On peut faire des démos impressionnantes, mais en production réelle, ça risque de donner du code 10 à 100 fois plus complexe
- J’ai eu une expérience similaire moi aussi
  J’ai demandé à Claude d’ajouter des statistiques de couverture de tests dans la CI, et comme nyc n’était pas installé, il a essayé de réimplémenter Istanbul en bash
  Au final, j’ai dû lui dire : « installe juste nyc »
- Vu que cette fonctionnalité n’a pas encore été publiée, Anthropic semble aussi juger que le modèle n’est pas encore prêt
  Malgré tout, ce genre d’expérimentations aidera probablement à repousser les limites du modèle
  Peut-être pas maintenant, mais en 2026, ce sera peut-être faisable
J’aimerais bien voir sur HN un vote récurrent sur le classement de popularité des agents de codage IA
Un peu comme l’index TIOBE par langage, pour suivre les tendances et voir quels modèles gagnent en popularité
- Il suffit de choisir celui qui te plaît et de l’utiliser
  La compétition autour des classements n’est au fond qu’un cycle de hype qui tourne en boucle
- Je viens justement de lancer un sondage similaire. N’hésitez pas à participer → agentic-coding-survey.pages.dev
- Ce n’est pas l’avis de la communauté, mais je consulte souvent le classement lmarena
  J’ai trouvé intéressant que MiniMax 2.1 soit devant la plupart des GPT
  Sur openrouter.ai, on peut aussi se faire une idée approximative du débit et du coût du modèle
- Je suis l’actualité récente via la newsletter de Zvi Mowshowitz
  C’est comme ça que j’ai adopté Opus 4.5 comme modèle principal une semaine seulement après sa sortie
- Ma compétence d’agent fait partie du top 10 du répertoire skills.sh
  Parmi ses utilisateurs, environ 80 % sont sur Claude Code, et 75 % dans un environnement darwin-arm64
Claude génère trop de code, ce qui rend la revue difficile
Certains disent « tant que les tests passent, c’est bon », mais pour des projets maintenus sur le long terme, ça reste inquiétant
J’aimerais bien connaître le retour d’expérience de ceux qui ont testé une génération de code en mode YOLO sur des projets exploités dans la durée
- En environnement pro réel, gérer un seul agent à la fois suffit largement
  La qualité du code reste encore faible et il se trompe souvent aussi en débogage
  En revanche, c’est utile pour la recherche, la compréhension et l’élargissement des idées
  Pour un projet expérimental personnel, une approche YOLO peut convenir
- Je travaille chez Graphite/Cursor, mais si on demande à CC de gérer les changements sous forme de stack et qu’on lui ajoute un agent de revue automatique, il devient beaucoup plus facile de comprendre de gros changements
  Ça permet d’automatiser la génération de code tout en gardant une compréhension du système
- Quand Claude Code écrit du code, je lui fais relire le dernier commit avec la compétence « codex-review » que j’ai créée
  Je demande à Codex de proposer des points de revue, puis je vérifie sa précision dans la vraie revue
- Il est encore trop tôt pour voir les résultats, mais d’ici la fin de l’année, on commencera probablement à voir ce que donnent des projets construits sur du sable
Il y avait cette formule disant qu’« on ne parle plus à un codeur IA mais à un team lead »,
et le plus drôle, c’est que même ce tweet semblait écrit par une IA
- Oui, ce genre de formulation rhétorique revient beaucoup trop souvent dans le discours des IA
En 2026, les orchestrateurs d’agents deviendront probablement une tendance majeure
Reprendre les termes classiques du logiciel comme team lead ou team member aidera à la compréhension et à l’adoption
- D’accord. Les concepts complexes comme Gas Town ne sont que des détours pour corriger les comportements anormaux des modèles
  Si Anthropic peut orchestrer directement ses propres modèles, ces couches deviendront inutiles
  Au final, l’essentiel, c’est la messagerie et la gestion des tâches
- Mais je pense que des concepts comme Polecats aident à éviter une anthropomorphisation excessive
La phrase « dire à un team lead et à toute son équipe : rendez ce bouton rouge » m’a fait rire
- « Ingénieur principal ! Il nous faut une architecture ! Équipe marketing, une pub avec une célébrité ! Équipe produit, la roadmap ! Équipe ML, intégrer les données d’entraînement ! Équipe finance, calculer le ROI ! Équipe ops, couverture 24/7 ! »
  Et au final, la conclusion était : « Très bien, maintenant rendez ce bouton rouge ! » Une satire parfaite
- Même si Claude peut faire ça avec un simple prompt, nous refuserons de reconnaître que ça suffit
  Cette vidéo donne bien l’idée
- Le prompt système par défaut semble bien savoir quand utiliser le mode swarm
  Si on ajoute des instructions supplémentaires dans CLAUDE.md, on peut aussi l’ajuster pour qu’il n’utilise pas le mode swarm sur des tâches triviales
Dans la version 2.1.9 récente, la façon dont la boucle principale orchestre les sous-agents a complètement changé
On voit apparaître des logs du type « l’agent FTSChunkManager est toujours en cours d’exécution mais progresse, attendons », avec en plus la stack trace et une sortie JSON
J’ai vu ce comportement directement dans l’app desktop Claude Code
Sous une tâche maître, une foule d’agents leaders de workers explorent la base de code, rédigent des rapports et des listes de TODO
Un autre système agrège ensuite tout ça pour produire un schéma directeur et un plan global
Moi, je crée séparément des chats devops, frontend, architecture et security ; à la fin de chaque chat, il laisse des logs et échange des mises à jour avec les autres
Si on le connecte en SSH à un droplet pour lui laisser utiliser le terminal, Claude répète de lui-même les cycles build, correction, test et validation
C’est comme ça que j’ai terminé ce projet en 3 jours
- En réalité, ce n’est que la fonctionnalité de base qui consiste à lancer plusieurs agents d’exploration en parallèle puis à fusionner leurs résultats
- Le comportement est très proche de oh-my-opencode

Présentation de Swarms, la nouvelle fonctionnalité cachée de Claude Code, un mode d’équipe multi-agents

Fonctionnement

Outil claude-sneakpeek

À lire aussi

1 commentaires

Réactions sur Hacker News

Outil `claude-sneakpeek`