Présentation de Swarms, la nouvelle fonctionnalité cachée de Claude Code, un mode d’équipe multi-agents
(twitter.com/NicerInPerson)- Swarms est une fonctionnalité d’orchestration multi-agents présente dans Claude Code mais qui n’avait pas été rendue publique
- L’utilisateur ne dialogue plus avec un seul codeur IA, mais interagit avec une IA jouant le rôle de chef d’équipe
- Le chef d’équipe n’écrit pas directement le code : il établit le plan, répartit les tâches et synthétise les résultats, puis attribue les rôles aux agents subordonnés
- Une fois le plan approuvé, des agents travailleurs spécialisés s’exécutent en parallèle et prennent en charge l’implémentation réelle
- Cela montre que Claude Code évolue au-delà d’un simple outil vers un processus de développement à l’échelle d’une équipe
Fonctionnement
- Lorsque l’utilisateur approuve le plan, le système bascule en Delegation Mode
- Plusieurs agents travailleurs spécialisés sont créés et travaillent en parallèle
- Chaque travailleur prend en charge des tâches d’implémentation concrètes comme l’écriture, l’analyse ou la modification de code
- Les messages échangés entre les travailleurs servent à coordonner l’avancement et les dépendances
- Tous les résultats sont agrégés par le chef d’équipe puis renvoyés sous forme de réponse finale
Outil claude-sneakpeek
- Le dépôt claude-sneakpeek propose un build parallèle avec les feature flags de Claude Code activés
- Il permet d’essayer des fonctionnalités non publiées, dont le mode Swarms, dans un environnement totalement séparé d’une installation existante de Claude Code
- Utilise une configuration, des sessions, des serveurs MCP et des identifiants d’authentification distincts
- Il fournit des fonctions supplémentaires intégrées à Claude Code mais pas encore publiées
- Prise en charge de l’exécution multi-agents native via le Swarm mode
- Création d’agents en arrière-plan via le Delegate mode
- Fonctions de messagerie entre membres de l’équipe et de gestion de l’attribution des tâches
- Prise en charge de modèles et fournisseurs supplémentaires
- Prend en charge Z.ai, MiniMax et OpenRouter, avec possibilité de connecter des modèles locaux via cc-mirror
1 commentaires
Réactions sur Hacker News
Honnêtement, ça peut sembler complètement dingue, mais c’est comme ça que j’ai obtenu le code de la plus haute qualité
Ça a coûté environ 10 fois plus cher, mais j’ai fait gérer toute une « équipe projet » avec plusieurs sous-agents par une seule instance d’Opus
La tâche consistait à porter un serveur Java legacy vers C# .NET 10, avec 9 agents, un Kanban en 7 étapes et une structure Git Worktree séparée
Les rôles étaient les suivants —
Manager (Claude Opus 4.5) : boucle d’événements globale qui réveille les agents selon l’état du Kanban
Product Owner (Claude Opus 4.5) : responsable de la stratégie, chargé d’éviter le scope creep
Scrum Master (Opus 4.5) : priorisation du backlog et attribution des tickets
Architecte (Sonnet 4.5) : uniquement la conception, pas l’implémentation
Archéologue (Grok-Free) : lit la décompilation du Java legacy uniquement quand c’est nécessaire
CAB (Opus 4.5) : gardien qui rejette des fonctionnalités aux étapes design et code
Binôme Dev (Sonnet 4.5 + Haiku 4.5) : boucle AD-TDD, le junior écrit les tests en échec, le senior corrige
Bibliothécaire (Gemini 2.5) : gestion de la documentation et déclenchement des rétrospectives
Franchement, à la question « est-ce vraiment nécessaire ? », la réponse est probablement « non », mais c’était trop amusant de voir des agents IA collaborer
La première version du processus est visible sur cette image
J’aimerais savoir si c’est purement basé sur des prompts, un plugin, ou une structure de rappels via script
Je me demande aussi où réside le Kanban
Avec un coordinateur et quelques agents spécialisés comme des experts backend, frontend et base de données
La clé, c’est le coordinateur. Il réduit ma charge cognitive et suit très bien l’avancement global
Un peu dans l’idée de « je ne veux pas parler aux singes, je veux parler à l’organiste » : au début, on ferait des entretiens avec le manager et le program manager, puis ils avanceraient seuls et on ne demanderait plus que des démos et des mises à jour. C’est drôle
En fait, ça exploite simplement la fonction de sous-agent intégrée à Claude
Pas besoin de créer en Go une sorte d’abstraction tmux de 300 000 lignes
Il suffit de demander à Claude de lancer du travail en parallèle avec des sous-agents en arrière-plan
C’est utile d’avoir des fichiers pour transmettre les prompts, suivre l’avancement et faire du reporting, et je recommande de limiter chaque agent à un worktree séparé
Je documente ce pattern sur workforest.space
La plupart des gens construisent un orchestrateur séparé, alors qu’en réalité Claude lui-même est le meilleur orchestrateur
La différence avec les outils existants, c’est qu’on passe d’une abstraction par conversation à une abstraction par tâche
Claude Code était jusqu’ici limité par les apps tierces et leur approche centrée sur la conversation, mais Claude Code Web est le premier à étendre ça
Cette approche laisse l’IA coordonner elle-même le travail, sans que l’utilisateur ait besoin d’envoyer des prompts en continu
C’est complexe, mais on évolue vers une structure où une IA en gère d’autres
Cela dit, les détails de planification restent insuffisants, donc la fiabilité est encore limitée
L’agent principal passe dans un mode de contexte centré sur la délégation, avec intégration d’un système de tâches en équipe et d’un système de boîtes aux lettres
C’est un niveau d’intégration qu’on ne peut pas obtenir avec un plugin
J’empile mes commits comme des PR puis je remets de l’ordre avec du rebase, et c’était assez pénible
Maintenant, j’ai l’impression que je peux améliorer ça en répartissant le travail sur 2 ou 3 branches et en gérant les conflits au minimum
Ça aide à garder un contexte propre tout en obtenant des résultats de haute qualité
J’aimerais que le code évolue vers quelque chose de plus court et de meilleure qualité
Mais j’ai l’impression que la tendance actuelle va dans le sens inverse
Quand les modèles seront plus robustes, avec plus de bon sens et de meilleures boucles de feedback, ce sera utile, mais pour l’instant ça aggrave plutôt le problème avec une logique du type « plus il y a de code, mieux c’est »
On peut faire des démos impressionnantes, mais en production réelle, ça risque de donner du code 10 à 100 fois plus complexe
J’ai demandé à Claude d’ajouter des statistiques de couverture de tests dans la CI, et comme
nycn’était pas installé, il a essayé de réimplémenter Istanbul en bashAu final, j’ai dû lui dire : « installe juste
nyc»Malgré tout, ce genre d’expérimentations aidera probablement à repousser les limites du modèle
Peut-être pas maintenant, mais en 2026, ce sera peut-être faisable
J’aimerais bien voir sur HN un vote récurrent sur le classement de popularité des agents de codage IA
Un peu comme l’index TIOBE par langage, pour suivre les tendances et voir quels modèles gagnent en popularité
La compétition autour des classements n’est au fond qu’un cycle de hype qui tourne en boucle
J’ai trouvé intéressant que MiniMax 2.1 soit devant la plupart des GPT
Sur openrouter.ai, on peut aussi se faire une idée approximative du débit et du coût du modèle
C’est comme ça que j’ai adopté Opus 4.5 comme modèle principal une semaine seulement après sa sortie
Parmi ses utilisateurs, environ 80 % sont sur Claude Code, et 75 % dans un environnement darwin-arm64
Claude génère trop de code, ce qui rend la revue difficile
Certains disent « tant que les tests passent, c’est bon », mais pour des projets maintenus sur le long terme, ça reste inquiétant
J’aimerais bien connaître le retour d’expérience de ceux qui ont testé une génération de code en mode YOLO sur des projets exploités dans la durée
La qualité du code reste encore faible et il se trompe souvent aussi en débogage
En revanche, c’est utile pour la recherche, la compréhension et l’élargissement des idées
Pour un projet expérimental personnel, une approche YOLO peut convenir
Ça permet d’automatiser la génération de code tout en gardant une compréhension du système
Je demande à Codex de proposer des points de revue, puis je vérifie sa précision dans la vraie revue
Il y avait cette formule disant qu’« on ne parle plus à un codeur IA mais à un team lead »,
et le plus drôle, c’est que même ce tweet semblait écrit par une IA
En 2026, les orchestrateurs d’agents deviendront probablement une tendance majeure
Reprendre les termes classiques du logiciel comme team lead ou team member aidera à la compréhension et à l’adoption
Si Anthropic peut orchestrer directement ses propres modèles, ces couches deviendront inutiles
Au final, l’essentiel, c’est la messagerie et la gestion des tâches
La phrase « dire à un team lead et à toute son équipe : rendez ce bouton rouge » m’a fait rire
Et au final, la conclusion était : « Très bien, maintenant rendez ce bouton rouge ! » Une satire parfaite
Cette vidéo donne bien l’idée
Si on ajoute des instructions supplémentaires dans
CLAUDE.md, on peut aussi l’ajuster pour qu’il n’utilise pas le mode swarm sur des tâches trivialesDans la version 2.1.9 récente, la façon dont la boucle principale orchestre les sous-agents a complètement changé
On voit apparaître des logs du type « l’agent FTSChunkManager est toujours en cours d’exécution mais progresse, attendons », avec en plus la stack trace et une sortie JSON
J’ai vu ce comportement directement dans l’app desktop Claude Code
Sous une tâche maître, une foule d’agents leaders de workers explorent la base de code, rédigent des rapports et des listes de TODO
Un autre système agrège ensuite tout ça pour produire un schéma directeur et un plan global
Moi, je crée séparément des chats devops, frontend, architecture et security ; à la fin de chaque chat, il laisse des logs et échange des mises à jour avec les autres
Si on le connecte en SSH à un droplet pour lui laisser utiliser le terminal, Claude répète de lui-même les cycles build, correction, test et validation
C’est comme ça que j’ai terminé ce projet en 3 jours