La taxe d’orchestration
(x.com/addyosmani)La « taxe d’orchestration » à l’ère des agents IA et le goulet d’étranglement de l’attention humaine
L’article d’Addy Osmani traite du fait que faire tourner plusieurs agents IA en même temps ne se traduit pas forcément par un gain de productivité immédiat. Les agents peuvent fonctionner en parallèle, mais le jugement humain nécessaire pour comprendre, vérifier et fusionner les résultats, lui, ne se parallélise pas. L’auteur appelle ce coût la « taxe d’orchestration ». Il s’agit du coût caché lié à la coordination de plusieurs flux de travail. Vu sous l’angle de la délégation, cela peut aussi se lire comme l’idée qu’il est plus important de ne déléguer que ce que l’on peut réellement relire correctement, plutôt que de déléguer davantage.
-
Argument principal
- Il explique qu’il est facile de lancer des agents IA, mais qu’il est bien plus difficile de vérifier leurs résultats et de les aligner avec d’autres modifications.
- Même en exécutant plusieurs agents, on ne crée pas pour autant « plus de versions de soi-même » : le jugement et la fusion doivent malgré tout passer par l’attention d’une seule personne.
- Il souligne que se sentir occupé n’est pas la même chose qu’être réellement productif.
- Même si l’on exécute 20 agents, cela ne signifie pas automatiquement l’équivalent de 20 tâches prêtes à être déployées.
-
La taxe d’orchestration
- L’auteur considère le coût de coordination entre plusieurs agents comme un problème structurel. Ce n’est pas simplement une question de manque de concentration ou de formation, mais un problème de conception du système.
- Les résultats produits par les agents doivent au final être revus par un humain. À ce stade, les questions d’exactitude, de cohérence avec l’architecture et de conflits de fusion convergent toutes vers une seule personne.
- L’humain devient donc le composant sériel lent du système d’agents IA. Par composant sériel, on entend la partie qui ne peut pas traiter plusieurs tâches en même temps et doit les gérer l’une après l’autre.
-
Analogie technique
- L’auteur compare cette situation au GIL de Python. Le GIL est le mécanisme qui fait que, même avec plusieurs threads, un seul peut exécuter du code Python à la fois.
- Les agents peuvent s’exécuter simultanément, mais dès qu’il faut une vraie compréhension et un vrai jugement, ils se retrouvent tous à attendre un verrou unique : l’attention humaine.
- Il mobilise aussi un principe d’ingénierie des performances selon lequel le gain de vitesse du traitement parallèle est limité par la partie qui ne peut pas être parallélisée. Autrement dit, même si l’on ajoute des agents, le débit global augmente difficilement si le temps de jugement ne diminue pas.
-
Avantages
- Les agents peuvent être utiles pour traiter en arrière-plan des tâches indépendantes.
- Des tâches comme l’écriture de tests ou la génération de captures d’écran, que la machine peut valider dans une certaine mesure, peuvent alléger la charge humaine.
- Il est proposé de regrouper la revue des résultats en une seule fois, afin de réduire le coût des changements de contexte permanents entre plusieurs tâches.
-
Limites et risques
- Augmenter le nombre d’agents n’augmente pas la bande passante cognitive humaine, c’est-à-dire la capacité à comprendre et à juger.
- Vérifier fréquemment les agents peut accroître la fatigue, car il faut à chaque fois recharger un contexte de travail différent.
- Si la revue devient superficielle, on risque d’accepter du code produit par des agents sans l’avoir suffisamment compris.
- Si ce coût n’est pas correctement géré, dette technique et dette cognitive peuvent s’accumuler ensemble. La dette technique désigne une charge dans le code difficile à corriger plus tard, et la dette cognitive le fait d’accumuler des changements sans que les développeurs comprennent réellement le système.
-
Ce qui distingue cette analyse
- Le texte met l’accent non pas sur la performance des agents IA en eux-mêmes, mais sur l’attention humaine.
- Il affirme que la productivité ne doit pas se mesurer au nombre d’agents lancés, mais à la quantité de travail réellement relue, fusionnée et prête à être déployée.
- Sa particularité est de considérer l’humain non comme un superviseur extérieur au système, mais comme une ressource limitée intégrée au système parallèle lui-même.
-
Pistes pratiques
- Il suggère d’adapter l’ampleur du recours aux agents non pas à ce que l’interface de l’outil autorise, mais au rythme auquel on est capable de faire une vraie revue.
- Il faut répartir les tâches : confier les tâches isolées à des agents en arrière-plan, et éviter de paralléliser les tâches où le jugement est central, comme les bugs étranges ou la conception d’architecture.
- L’attention humaine doit être réservée au jugement, tandis que les parties vérifiables par la machine devraient d’abord être démontrées par les agents à l’aide de tests ou de preuves.
- La délégation ne prend ici sens que de manière très limitée. Plus que la capacité à déléguer beaucoup, c’est la capacité à distinguer ce qui peut être délégué de ce qui exige un jugement direct qui compte.
Ce texte souligne que le goulet d’étranglement dans l’usage des agents IA n’est peut-être pas la capacité d’exécution, mais la capacité de revue et de jugement. Il est devenu facile de faire tourner plusieurs agents, mais assumer de manière responsable leurs résultats reste une tâche humaine. La productivité ne vient donc pas d’une simple augmentation du nombre d’agents, mais d’une organisation du travail qui traite sa propre attention comme une ressource système essentielle. La délégation obéit au même principe : l’essentiel n’est pas d’en confier davantage, mais de ne confier que ce que l’on peut réellement juger correctement.
2 commentaires
Moi aussi, c’est quelque chose que je ressens en ce moment : quand je lance 10 à 20 tâches en parallèle, puis que je reviens les examiner une par une, je n’arrive plus à faire le changement de contexte, et je me retrouve à me dire « c’était quoi déjà, ça ?? » en essayant de me remémorer.
Si on procède en tâches séquentielles, la validation et la relecture humaines deviennent forcément le goulot d’étranglement.
Au final, le flux de travail doit basculer vers un traitement parallèle par des agents,
mais les capacités cognitives humaines ont leurs limites.
On dirait qu’on est entré dans une époque où la mise en place d’une boucle de validation devient la clé de la qualité et de la prévention des incidents.
Et cette validation ne doit pas seulement reposer sur l’humain : il faut aussi que les agents se contrôlent mutuellement pour renforcer solidement les étapes de vérification.