6 points par hon2yb22 2026-04-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Pourquoi, avec le même modèle d’IA et les mêmes humains, les résultats diffèrent-ils ?
À chaque fois, on repart de zéro, chaque équipe utilise les agents à sa manière, ce qui provoque des conflits de code, et l’on accumule des prototypes impossibles à exploiter en production…

On retrouve ici un dysfonctionnement chronique qui survient lors de la collaboration entre personnes utilisant des outils d’IA.

Quand un développeur à l’aise avec la technologie demande à Claude Code d’implémenter un workflow, il obtient un excellent code. Mais lorsqu’un développeur débutant adresse la même demande au même Claude Code, le résultat est un code générique, incohérent et subtilement erroné. C’est pourtant le même modèle. Pourquoi ?

Le problème ne venait pas du modèle, mais du Context Gap — et cela s’applique autant aux humains qu’aux agents IA.
La raison pour laquelle un nouveau membre d’équipe, lancé sans onboarding, se perd dans la même codebase est la même : les conventions sont implicites, l’architecture n’existe que dans la tête de quelqu’un, et il n’y a pas d’environnement structuré pour guider le travail. Les agents IA ne sont pas différents.

Même les experts butent sur cette limite. Quand la session change, l’agent oublie la conception précédente. L’agent d’aujourd’hui ne connaît pas l’architecture décidée hier. Le savoir n’existe que dans la tête des gens, pas dans la codebase. Si un humain ne peut pas retrouver les conventions, l’agent non plus.

Pour résoudre cela, il ne faut ni améliorer les prompts ni choisir un meilleur modèle. Il faut concevoir l’environnement lui-même, dans lequel humains et agents travaillent ensemble.

[ Le harness a toujours existé. ]

Le mot harness vient de l’ancien français harnois. Son sens d’origine est « équipement militaire, outil de contrôle ».
À partir des années 1690, son sens figuré s’établit : « contrôler une force non maîtrisée pour l’utiliser dans la bonne direction (to control for use as power) ».
C’est le même principe que lorsqu’on dit qu’une éolienne « harnesses » le vent pour le transformer en énergie.

En ingénierie, ce principe est réapparu encore et encore sous différentes formes.

  • Wiring Harness : un dispositif qui regroupe des câbles enchevêtrés en un seul faisceau pour en faire une unité contrôlable. C’est un standard de l’industrie automobile depuis des décennies.
  • Test Harness : un environnement d’exécution composé de stubs et de drivers, permettant d’isoler et d’exécuter un composant donné sans toute l’infrastructure. C’est un concept central du test logiciel.
  • Pipelines CI/CD : un environnement de contrôle structuré qui fait passer le code par des couches de build, de test et de validation au lieu de le laisser partir directement en production. C’est aussi une forme de harness.

Ils ont tous un point commun.

La conception d’un environnement externe destiné à canaliser correctement un élément non maîtrisé (câbles, composants logiciels, flux de déploiement).

C’est pourquoi, début 2026, lorsque OpenAI a construit avec l’agent Codex un système d’un million de lignes sur cinq mois sans écrire une seule ligne de code manuellement, il était naturel de nommer Harness Engineering l’application de cet ancien principe aux agents IA. Ce n’est pas un hasard si Martin Fowler comme l’équipe d’ingénierie d’Anthropic ont employé le même terme à la même période.

LangChain aussi a amélioré uniquement le harness pour faire passer son classement Terminal Bench 2.0 de la 30e à la 5e place.

C’est ainsi qu’act-operator a été conçu comme un harness de contrôle structurel pour LangGraph 1.0+, utilisable dans de vrais produits.

[ Ultra-Quick Start ]}

Dans un environnement où uv est installé, une seule ligne ci-dessous suffit pour terminer la configuration d’un harness de projet LangGraph 1.0+ réellement prêt pour la production.

uvx --from act-operator act new

[ Les 3 couches d’Act Operator ]

Dans le développement basé sur l’IA, le harness est un système de scaffolding, de savoir exécutable et de boucle de feedback qui enveloppe à la fois les humains et les agents IA afin qu’ils puissent produire de manière fiable les bons résultats, quel que soit l’auteur du travail.

Act Operator implémente cela en trois couches :

  1. Scaffolding : un squelette de projet complet, assemblé avant le premier prompt adressé à l’agent, avec conventions de modules et classes de base intégrées garantissant un couplage minimal et une cohésion maximale
  2. SSOT exécutable : un savoir encodé dans des fichiers actionnables, lus à l’exécution par l’agent comme par l’humain
  3. Boucle de feedback : des spécifications qui maintiennent l’agent aligné d’une session à l’autre

[ SSOT exécutable ]

Dans une équipe classique, les connaissances de développement et de conception sont partagées via un wiki, des documents d’architecture, du savoir oral — voire parfois pas du tout. Le problème, c’est que les documents vieillissent, les wikis se périment, et le savoir oral ne survit pas aux changements d’équipe.

Le harness encode ce savoir dans des fichiers opérationnels — non pas dans de la documentation statique, mais dans des références exécutables directement lues par les agents et les humains. Act Operator les gère en trois couches complémentaires de composants SSOT, pensées en termes de couplage et de cohésion :

  1. Act Template (scaffold) : le squelette du projet lui-même — workflows CI de base, classes de base, structure de tests, configuration monorepo, gestion des variables d’environnement, guide d’utilisation
  2. Agent Skills : 5 skills au total, plus de 50 patterns de référence, arbres de décision et templates d’architecture
  3. Drawkit : des shapes Act prédéfinies pour draw.io — un vocabulaire visuel partagé pour la communication entre humains

Chaque composant vise un public différent tout en s’appuyant sur les mêmes conventions sous-jacentes. Act Template établit la base structurelle sur laquelle travaillent à la fois les agents et les développeurs. Les skills montrent à l’agent comment construire correctement dans cette structure, et Drawkit apprend à l’équipe comment visualiser l’architecture.

[ Autres informations open source ]

  • En plus de Claude Code, cela fonctionne avec tout outil prenant en charge un répertoire de skills, comme OpenCode, Cursor ou Gemini CLI.
  • Documentation disponible en français/anglais
  • Licence Apache 2.0 – distribution 200 % gratuite sur PIPY

Tous les retours et toutes les contributions de chacun sont les bienvenus (ainsi que les GitHub stars★.. !). Merci :)

Github: https://github.com/Proact0/act-operator

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.