15 points par GN⁺ 2026-01-25 | 1 commentaires | Partager sur WhatsApp
  • Swarms est une fonctionnalité d’orchestration multi-agents présente dans Claude Code mais qui n’avait pas été rendue publique
  • L’utilisateur ne dialogue plus avec un seul codeur IA, mais interagit avec une IA jouant le rôle de chef d’équipe
  • Le chef d’équipe n’écrit pas directement le code : il établit le plan, répartit les tâches et synthétise les résultats, puis attribue les rôles aux agents subordonnés
  • Une fois le plan approuvé, des agents travailleurs spécialisés s’exécutent en parallèle et prennent en charge l’implémentation réelle
  • Cela montre que Claude Code évolue au-delà d’un simple outil vers un processus de développement à l’échelle d’une équipe

Fonctionnement

  • Lorsque l’utilisateur approuve le plan, le système bascule en Delegation Mode
  • Plusieurs agents travailleurs spécialisés sont créés et travaillent en parallèle
  • Chaque travailleur prend en charge des tâches d’implémentation concrètes comme l’écriture, l’analyse ou la modification de code
  • Les messages échangés entre les travailleurs servent à coordonner l’avancement et les dépendances
  • Tous les résultats sont agrégés par le chef d’équipe puis renvoyés sous forme de réponse finale

Outil claude-sneakpeek

  • Le dépôt claude-sneakpeek propose un build parallèle avec les feature flags de Claude Code activés
  • Il permet d’essayer des fonctionnalités non publiées, dont le mode Swarms, dans un environnement totalement séparé d’une installation existante de Claude Code
    • Utilise une configuration, des sessions, des serveurs MCP et des identifiants d’authentification distincts
  • Il fournit des fonctions supplémentaires intégrées à Claude Code mais pas encore publiées
    • Prise en charge de l’exécution multi-agents native via le Swarm mode
    • Création d’agents en arrière-plan via le Delegate mode
    • Fonctions de messagerie entre membres de l’équipe et de gestion de l’attribution des tâches
  • Prise en charge de modèles et fournisseurs supplémentaires
    • Prend en charge Z.ai, MiniMax et OpenRouter, avec possibilité de connecter des modèles locaux via cc-mirror

1 commentaires

 
GN⁺ 2026-01-25
Réactions sur Hacker News
  • Honnêtement, ça peut sembler complètement dingue, mais c’est comme ça que j’ai obtenu le code de la plus haute qualité
    Ça a coûté environ 10 fois plus cher, mais j’ai fait gérer toute une « équipe projet » avec plusieurs sous-agents par une seule instance d’Opus
    La tâche consistait à porter un serveur Java legacy vers C# .NET 10, avec 9 agents, un Kanban en 7 étapes et une structure Git Worktree séparée
    Les rôles étaient les suivants —
    Manager (Claude Opus 4.5) : boucle d’événements globale qui réveille les agents selon l’état du Kanban
    Product Owner (Claude Opus 4.5) : responsable de la stratégie, chargé d’éviter le scope creep
    Scrum Master (Opus 4.5) : priorisation du backlog et attribution des tickets
    Architecte (Sonnet 4.5) : uniquement la conception, pas l’implémentation
    Archéologue (Grok-Free) : lit la décompilation du Java legacy uniquement quand c’est nécessaire
    CAB (Opus 4.5) : gardien qui rejette des fonctionnalités aux étapes design et code
    Binôme Dev (Sonnet 4.5 + Haiku 4.5) : boucle AD-TDD, le junior écrit les tests en échec, le senior corrige
    Bibliothécaire (Gemini 2.5) : gestion de la documentation et déclenchement des rétrospectives
    Franchement, à la question « est-ce vraiment nécessaire ? », la réponse est probablement « non », mais c’était trop amusant de voir des agents IA collaborer
    La première version du processus est visible sur cette image

    • Je me demande si tu pourrais partager des détails techniques
      J’aimerais savoir si c’est purement basé sur des prompts, un plugin, ou une structure de rappels via script
      Je me demande aussi où réside le Kanban
    • J’utilise une structure assez proche moi aussi
      Avec un coordinateur et quelques agents spécialisés comme des experts backend, frontend et base de données
      La clé, c’est le coordinateur. Il réduit ma charge cognitive et suit très bien l’avancement global
    • En général, un Scrum Master n’assigne pas directement les tickets
    • Je pense que la prochaine étape, c’est de transformer ce que tu as construit en service
      Un peu dans l’idée de « je ne veux pas parler aux singes, je veux parler à l’organiste » : au début, on ferait des entretiens avec le manager et le program manager, puis ils avanceraient seuls et on ne demanderait plus que des démos et des mises à jour. C’est drôle
    • Je me demande si c’est de la satire ou si c’est sincère
  • En fait, ça exploite simplement la fonction de sous-agent intégrée à Claude
    Pas besoin de créer en Go une sorte d’abstraction tmux de 300 000 lignes
    Il suffit de demander à Claude de lancer du travail en parallèle avec des sous-agents en arrière-plan
    C’est utile d’avoir des fichiers pour transmettre les prompts, suivre l’avancement et faire du reporting, et je recommande de limiter chaque agent à un worktree séparé
    Je documente ce pattern sur workforest.space
    La plupart des gens construisent un orchestrateur séparé, alors qu’en réalité Claude lui-même est le meilleur orchestrateur

    • Ce n’est pas un simple sous-agent
      La différence avec les outils existants, c’est qu’on passe d’une abstraction par conversation à une abstraction par tâche
      Claude Code était jusqu’ici limité par les apps tierces et leur approche centrée sur la conversation, mais Claude Code Web est le premier à étendre ça
      Cette approche laisse l’IA coordonner elle-même le travail, sans que l’utilisateur ait besoin d’envoyer des prompts en continu
      C’est complexe, mais on évolue vers une structure où une IA en gère d’autres
    • En réalité, ce n’est pas une nouvelle fonctionnalité, mais plutôt une mise en application des sous-agents que Claude Code possédait déjà
      Cela dit, les détails de planification restent insuffisants, donc la fiabilité est encore limitée
    • C’est différent des sous-agents existants
      L’agent principal passe dans un mode de contexte centré sur la délégation, avec intégration d’un système de tâches en équipe et d’un système de boîtes aux lettres
      C’est un niveau d’intégration qu’on ne peut pas obtenir avec un plugin
    • La visualisation des « stacked PR » m’a permis de comprendre le concept immédiatement
      J’empile mes commits comme des PR puis je remets de l’ordre avec du rebase, et c’était assez pénible
      Maintenant, j’ai l’impression que je peux améliorer ça en répartissant le travail sur 2 ou 3 branches et en gérant les conflits au minimum
    • Moi aussi, je garde l’instance Claude principale dans un rôle de manager, pour superviser les agents d’implémentation
      Ça aide à garder un contexte propre tout en obtenant des résultats de haute qualité
  • J’aimerais que le code évolue vers quelque chose de plus court et de meilleure qualité
    Mais j’ai l’impression que la tendance actuelle va dans le sens inverse
    Quand les modèles seront plus robustes, avec plus de bon sens et de meilleures boucles de feedback, ce sera utile, mais pour l’instant ça aggrave plutôt le problème avec une logique du type « plus il y a de code, mieux c’est »
    On peut faire des démos impressionnantes, mais en production réelle, ça risque de donner du code 10 à 100 fois plus complexe

    • J’ai eu une expérience similaire moi aussi
      J’ai demandé à Claude d’ajouter des statistiques de couverture de tests dans la CI, et comme nyc n’était pas installé, il a essayé de réimplémenter Istanbul en bash
      Au final, j’ai dû lui dire : « installe juste nyc »
    • Vu que cette fonctionnalité n’a pas encore été publiée, Anthropic semble aussi juger que le modèle n’est pas encore prêt
      Malgré tout, ce genre d’expérimentations aidera probablement à repousser les limites du modèle
      Peut-être pas maintenant, mais en 2026, ce sera peut-être faisable
  • J’aimerais bien voir sur HN un vote récurrent sur le classement de popularité des agents de codage IA
    Un peu comme l’index TIOBE par langage, pour suivre les tendances et voir quels modèles gagnent en popularité

    • Il suffit de choisir celui qui te plaît et de l’utiliser
      La compétition autour des classements n’est au fond qu’un cycle de hype qui tourne en boucle
    • Je viens justement de lancer un sondage similaire. N’hésitez pas à participer → agentic-coding-survey.pages.dev
    • Ce n’est pas l’avis de la communauté, mais je consulte souvent le classement lmarena
      J’ai trouvé intéressant que MiniMax 2.1 soit devant la plupart des GPT
      Sur openrouter.ai, on peut aussi se faire une idée approximative du débit et du coût du modèle
    • Je suis l’actualité récente via la newsletter de Zvi Mowshowitz
      C’est comme ça que j’ai adopté Opus 4.5 comme modèle principal une semaine seulement après sa sortie
    • Ma compétence d’agent fait partie du top 10 du répertoire skills.sh
      Parmi ses utilisateurs, environ 80 % sont sur Claude Code, et 75 % dans un environnement darwin-arm64
  • Claude génère trop de code, ce qui rend la revue difficile
    Certains disent « tant que les tests passent, c’est bon », mais pour des projets maintenus sur le long terme, ça reste inquiétant
    J’aimerais bien connaître le retour d’expérience de ceux qui ont testé une génération de code en mode YOLO sur des projets exploités dans la durée

    • En environnement pro réel, gérer un seul agent à la fois suffit largement
      La qualité du code reste encore faible et il se trompe souvent aussi en débogage
      En revanche, c’est utile pour la recherche, la compréhension et l’élargissement des idées
      Pour un projet expérimental personnel, une approche YOLO peut convenir
    • Je travaille chez Graphite/Cursor, mais si on demande à CC de gérer les changements sous forme de stack et qu’on lui ajoute un agent de revue automatique, il devient beaucoup plus facile de comprendre de gros changements
      Ça permet d’automatiser la génération de code tout en gardant une compréhension du système
    • Quand Claude Code écrit du code, je lui fais relire le dernier commit avec la compétence « codex-review » que j’ai créée
      Je demande à Codex de proposer des points de revue, puis je vérifie sa précision dans la vraie revue
    • Il est encore trop tôt pour voir les résultats, mais d’ici la fin de l’année, on commencera probablement à voir ce que donnent des projets construits sur du sable
  • Il y avait cette formule disant qu’« on ne parle plus à un codeur IA mais à un team lead »,
    et le plus drôle, c’est que même ce tweet semblait écrit par une IA

    • Oui, ce genre de formulation rhétorique revient beaucoup trop souvent dans le discours des IA
  • En 2026, les orchestrateurs d’agents deviendront probablement une tendance majeure
    Reprendre les termes classiques du logiciel comme team lead ou team member aidera à la compréhension et à l’adoption

    • D’accord. Les concepts complexes comme Gas Town ne sont que des détours pour corriger les comportements anormaux des modèles
      Si Anthropic peut orchestrer directement ses propres modèles, ces couches deviendront inutiles
      Au final, l’essentiel, c’est la messagerie et la gestion des tâches
    • Mais je pense que des concepts comme Polecats aident à éviter une anthropomorphisation excessive
  • La phrase « dire à un team lead et à toute son équipe : rendez ce bouton rouge » m’a fait rire

    • « Ingénieur principal ! Il nous faut une architecture ! Équipe marketing, une pub avec une célébrité ! Équipe produit, la roadmap ! Équipe ML, intégrer les données d’entraînement ! Équipe finance, calculer le ROI ! Équipe ops, couverture 24/7 ! »
      Et au final, la conclusion était : « Très bien, maintenant rendez ce bouton rouge ! » Une satire parfaite
    • Même si Claude peut faire ça avec un simple prompt, nous refuserons de reconnaître que ça suffit
      Cette vidéo donne bien l’idée
    • Le prompt système par défaut semble bien savoir quand utiliser le mode swarm
      Si on ajoute des instructions supplémentaires dans CLAUDE.md, on peut aussi l’ajuster pour qu’il n’utilise pas le mode swarm sur des tâches triviales
  • Dans la version 2.1.9 récente, la façon dont la boucle principale orchestre les sous-agents a complètement changé
    On voit apparaître des logs du type « l’agent FTSChunkManager est toujours en cours d’exécution mais progresse, attendons », avec en plus la stack trace et une sortie JSON

  • J’ai vu ce comportement directement dans l’app desktop Claude Code
    Sous une tâche maître, une foule d’agents leaders de workers explorent la base de code, rédigent des rapports et des listes de TODO
    Un autre système agrège ensuite tout ça pour produire un schéma directeur et un plan global
    Moi, je crée séparément des chats devops, frontend, architecture et security ; à la fin de chaque chat, il laisse des logs et échange des mises à jour avec les autres
    Si on le connecte en SSH à un droplet pour lui laisser utiliser le terminal, Claude répète de lui-même les cycles build, correction, test et validation
    C’est comme ça que j’ai terminé ce projet en 3 jours

    • En réalité, ce n’est que la fonctionnalité de base qui consiste à lancer plusieurs agents d’exploration en parallèle puis à fusionner leurs résultats
    • Le comportement est très proche de oh-my-opencode