32 points par shalome7 22 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Récemment, le projet « Paperclip », qui promet de pouvoir faire fonctionner une « zero-human company » grâce à l’IA, a fait beaucoup parler de lui. Il organise des agents comme un organigramme d’entreprise, leur attribue des rôles de CEO, de chef d’équipe et d’opérationnel, puis, une fois la mission de l’entreprise et les projets détaillés définis, ils commencent à travailler de manière autonome. En un mois, le projet a dépassé les 40 000 étoiles sur GitHub.

Avant cela, il y avait déjà Gastown, qui suivait une approche similaire en prenant la « ville » comme métaphore des agents, ainsi que Claude Code Agent Teams d’Anthropic et les agents cloud de Cursor — dans l’ensemble du secteur, la tendance à « faire tourner plusieurs agents comme une organisation » est désormais très nette.

Moi aussi, poussé par la curiosité, j’ai essayé Gastown et Paperclip. Si l’on calcule en coût de jetons API, j’ai dépensé environ 5 000 $. 🫠
Pour vous donner directement la conclusion : il y avait bien quelques domaines où l’approche était clairement efficace, mais les limites étaient bien plus évidentes.

Le coût en jetons est de 5 à 10 fois supérieur à celui d’un agent unique, sans que la productivité suive proportionnellement. De plus, les agents perdaient le contexte, la transmission des tâches se rompait en cours de route, ou encore ils validaient eux-mêmes comme « terminé » un résultat erroné. Comme ces problèmes revenaient sans cesse, j’ai décidé de résumer les difficultés que j’ai rencontrées ainsi que les enseignements que j’en ai tirés :

→ Les 3 goulets d’étranglement structurels de l’orchestration multi-agents
→ Pourquoi les métaphores de la « ville » ou de l’« entreprise » fonctionnent mal
→ Quelle structure est réellement robuste en pratique
→ 5 critères et une méthode de scoring pour déterminer, dans mon travail, les domaines pouvant être délégués à des agents

J’espère que cela sera utile à celles et ceux qui, à l’ère des agents, se demandent « quoi déléguer, et quoi ne pas déléguer ».

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.