130 points par xguru 2026-03-29 | 7 commentaires | Partager sur WhatsApp
  • « Configure-moi un harness » : un simple mot suffit pour concevoir une équipe d’agents spécialisés adaptée à un domaine, et générer automatiquement jusqu’aux skills qu’utiliseront les agents, via une méta-skill
  • Prend en charge 6 modèles d’architecture, avec orchestration entre agents et protocoles de gestion d’erreurs
  • Modèles d’architecture
    • Pipeline : tâches séquentielles avec dépendances
    • Fan-out/Fan-in : tâches indépendantes en parallèle
    • Pool d’experts : sélection et appel selon le contexte
    • Génération-vérification : génération suivie d’un contrôle qualité
    • Superviseur : un agent central répartit dynamiquement les tâches
    • Délégation hiérarchique : délégation récursive du niveau supérieur vers le niveau inférieur
  • Workflow en 6 étapes : analyse du domaine → conception de l’architecture d’équipe (équipe d’agents vs sous-agents) → génération des définitions d’agents → génération des skills → intégration et orchestration → validation et tests
  • Deux modes d’exécution :
    • Équipe d’agents (par défaut) : approche TeamCreate + SendMessage + TaskCreate, recommandée dès qu’il faut au moins 2 agents ou de la collaboration
    • Sous-agents : appel direct de l’outil Agent, adapté aux tâches ponctuelles sans besoin de communication
  • Lors de l’exécution de Harness, des fichiers de définition d’agents sont automatiquement créés dans .claude/agents/ (par ex. analyst.md, builder.md, qa.md), et des fichiers de skills dans .claude/skills/
  • Exemples d’équipes pouvant être générées
    • Recherche approfondieConfigure-moi un harness de recherche. J’ai besoin d’une équipe d’agents capable d’enquêter sur n’importe quel sujet sous plusieurs angles — recherche web, sources académiques, réactions de la communauté — puis de rédiger un rapport de synthèse après validation croisée.
    • Création de site webConfigure-moi un harness de développement de site web full stack. J’ai besoin d’une équipe qui coordonne en pipeline le design, le frontend (React/Next.js), le backend (API) et les tests QA, du wireframe jusqu’au déploiement.
    • Production de webtoonConfigure-moi un harness de production d’épisodes de webtoon. J’ai besoin d’agents pour l’écriture de l’histoire, les prompts de character design, la planification de la mise en page des cases et l’édition des dialogues, avec revue mutuelle des livrables pour garantir la cohérence du style.
    • Planification de contenu YouTubeConfigure-moi un harness de production de contenu YouTube. J’ai besoin d’une équipe où un agent superviseur coordonne l’étude des tendances, l’écriture du script, l’optimisation SEO des titres/tags et la conception du concept de miniature.
    • Code reviewConfigure-moi un harness complet de code review. J’ai besoin d’une équipe où des agents auditent en parallèle l’architecture, les vulnérabilités de sécurité, les goulets d’étranglement de performance et le style de code, puis fusionnent les résultats dans un seul rapport.
    • Rédaction de documentation techniqueConfigure-moi un harness qui génère automatiquement la documentation API à partir de cette base de code. J’ai besoin d’une équipe qui traite en pipeline l’analyse des endpoints, la rédaction des explications, la génération d’exemples d’utilisation et la revue de complétude.
    • Conception de pipeline de donnéesConfigure-moi un harness de conception de pipeline de données. J’ai besoin d’une équipe d’agents qui délègue de façon hiérarchique la conception du schéma, la logique ETL, les règles de validation des données et la configuration du monitoring.
    • Campagne marketingConfigure-moi un harness de création de campagne marketing. J’ai besoin d’une équipe qui mène l’étude du marché cible, la rédaction des textes publicitaires, la conception du concept visuel et la planification des tests A/B, avec des revues qualité itératives.
  • revfactory/harness-100 — publication de 100 harness d’équipes d’agents production-ready sur 10 domaines (200 packages coréen/anglais)
    • Chaque harness inclut 4 à 5 agents spécialisés, une skill d’orchestration et des skills spécifiques au domaine
    • Ensemble composé de 1 808 fichiers Markdown couvrant la création de contenu, le développement logiciel, la data/IA, la stratégie business, l’éducation, le juridique, la santé, etc.
    • Tous générés avec le plugin Harness
  • Activation nécessaire de la fonction d’équipe d’agents de Claude Code : CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

7 commentaires

 
namojo 2026-04-01

Le résultat après un usage réel est impressionnant. La structure même de Harness, créée par Minho, fonctionne en fan-in/fan-out, génère plusieurs agents multi-agents adaptés à l’objectif en fonction des instructions, puis un orchestrateur les gère en décomposant chaque étape du travail en plusieurs phases.

Le niveau des livrables est quasi professionnel : cela peut aller d’un rapport à une application complète, avec les différents agents nécessaires — développeur, testeur, reviewer, analyste — qui remplissent chacun leur rôle avec un très bon niveau.

On pourrait penser que, comme avec MCP ou d’autres outils, Harness maintient en permanence un contexte très large et consomme donc rapidement les tokens, mais en ouvrant le contexte on voit qu’il est utilisé avec une efficacité maximale. En revanche, pour obtenir ce que nous considérons comme une bonne lisibilité ou un rendu plus soigné, il faut créer puis ajouter une skill de génération d’images Nanobanana basée sur l’API Gemini.

Même avec Claude Max 200, la limite quotidienne sera probablement atteinte en 1 à 2 heures, et j’ai utilisé Opus.

Voici le résultat obtenu après lui avoir donné un itinéraire de voyage au Japon et lui avoir demandé, en tant que guide de voyage au Japon, de créer une page d’itinéraire interactive. Pour ce genre de chose, ça consomme peu de tokens et c’est réalisé très vite.

http://namojo.github.io/tokyo-tour

 
tested 2026-03-30

Des retours de personnes qui l’ont utilisé ?

 
xguru 2026-03-29

C’est un projet créé par Minho Hwang, responsable de l’équipe stratégie AI Native chez Kakao.
J’avais vu plusieurs fois ses posts de présentation, donc j’attendais sa sortie avec impatience.
Je vais l’essayer !

 
edunga1 2026-04-06

Si vous utilisez déjà l’équipe d’agents Claude Code, il n’y avait rien de particulièrement nouveau.
En revanche, il était pratique de construire l’infrastructure en utilisant des agents ou des skills afin de pouvoir reprendre le travail dans de nouvelles sessions, avec des informations comme la composition de l’équipe.
Quand on constituait l’équipe manuellement, des éléments répétitifs comparables à du boilerplate pour l’équipe revenaient sans cesse.

Il y avait toutefois un problème : comme l’environnement prenait en compte à la fois les subagents et l’agent team, dans le pattern Supervisor, il arrivait souvent que le superviseur délègue des tâches à un subagent alors même que l’équipe avait déjà été créée.

 
neocode24 2026-03-31

Le maximum est de 100, mais j’ai atteint la limite de tokens dès le démarrage, snif.

 
neocode24 2026-03-31

J’ai pris le temps de récapituler ce que j’ai mis en place. Je l’ai appliqué en conditions réelles sur le monorepo VibeCoding.

Parmi les modes A (développement), B (audit de code) et C (intégration : A+B), comme il s’agissait d’un projet déjà en cours, j’ai procédé en mode B.
Cela a permis d’identifier des points que l’analyse statique ne détecte pas, comme des incohérences de types entre le front-end et le back-end.
J’ai résumé le processus de mise en place.

https://blog.neocode24.com/blog/claude-code-harness-real-world/

 
wang3281 2026-03-30

Comme je développe Harness à titre personnel, je suis curieux de savoir quels résultats de tests montrent les effets de l’adoption de projets open source. Je me demande s’il existe des outils de benchmark quantifiés et officiels… Je serais aussi curieux de savoir comment les autres vérifient habituellement l’efficacité, au-delà du simple ressenti.