Geas - Faire respecter à un agent IA des protocoles de travail stricts pour éviter les erreurs
(github.com/choam2426)Bonjour, je suis un jeune chercheur en sécurité qui utilise énormément Claude Code dans son travail.
Contexte
C’était un jour comme les autres où je travaillais avec Claude Code.
Comme je devais mener une tâche importante et de grande ampleur, j’ai consacré beaucoup d’efforts à lui faire comprendre le travail et à établir un plan.
Après de longues discussions, je lui ai fait créer un fichier de plan puis faire une auto-revue, et il a trouvé énormément de problèmes critiques.
Comme j’avais beaucoup investi dans la préparation, je me suis entêté avec l’idée qu’« il faut un plan parfait… un plan parfait… », et je lui ai fait refaire des auto-revues sans fin jusqu’à ce qu’il n’y ait plus aucun problème.
Mais même après pas moins de 17 auto-revues, les problèmes n’avaient pas disparu, et on en est arrivé à un point où il dépassait le périmètre défini au départ, avec des modifications inutiles et même la création de nouvelles choses.
Pendant que je me prenais la tête, diverses bribes de savoir sur l’IA aperçues sur GeekNews, dans des newsletters et ailleurs me sont revenues à l’esprit : « tendance à se surestimer », « devient paresseuse quand le travail s’allonge », « middle in the lost », etc. C’est ainsi que, en considérant Claude comme une sorte de personnalité à part entière, j’en suis arrivé à cette conclusion : « Claude est un génie paresseux ».
C’est un projet parti de cette idée : « Comment faire pour pousser ce génie paresseux à rester à 100 % en permanence ? » et « Si je veux devenir paresseux, il faut qu’eux soient appliqués. »
Le projet se compose actuellement de deux éléments.
- protocole
- un plugin Claude Code qui force le respect de ce protocole
Je serais curieux d’avoir l’avis de ceux qui se sont posé les mêmes questions.
Aucun commentaire pour le moment.