Faire coder serré à Claude et faire râler Codex — un schéma de terrain pour répartir deux agents sur le même repo

(rubric.im)

9 points par neostom432 17 시간 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Ces derniers temps, sur X et Discord, les posts du genre « on utilise Claude Code et Codex ensemble » se multiplient franchement. Comme tout le monde disait que c’était bien, j’ai vraiment installé les deux outils sur le même repo et je les ai fait tourner ensemble pendant environ un mois. Au moment de les adopter, je me suis vite rendu compte qu’il y avait une foule de points à trancher : par où commencer le setup, comment répartir les rôles entre les deux outils sans créer de conflits, et s’il faut remplir AGENTS.md et CLAUDE.md avec le même contenu. J’ai donc organisé tout cela sous forme d’un curriculum en 8 chapitres, pour aider celles et ceux qui n’arrivent pas à se lancer à cause des mêmes hésitations à réduire leurs tâtonnements.

Le workflow à double agent est simple. Si on demande au même modèle de coder puis de relire son propre code, il accepte telles quelles les hypothèses qu’il a lui-même posées et passe facilement à côté des failles. L’idée est donc de placer à côté un autre modèle comme reviewer advisory (non bloquant). Claude Code devient le rédacteur principal, Codex le reviewer advisory. La question n’est pas de savoir lequel est le plus intelligent : le point clé, c’est qu’ils sont différents. Dès qu’ils deviennent mutuellement des gates, le workflow se casse ; la règle la plus importante est donc de ne jamais rendre l’advisory bloquant.

Contexte — les changements que j’ai repassés en revue en structurant tout cela

• Avant, la question était : « quel outil de coding IA est le meilleur ? »
• Maintenant, la question est : « comment répartir les rôles entre deux outils ou plus ? », « comment couvrir avec un autre outil les angles morts d’un outil donné ? »
• Avec les slash commands et les subagents de Claude Code, la séparation review/exec de Codex, et des fichiers de contexte comme AGENTS.md, on est enfin à un moment où inscrire une structure à deux niveaux dans le workflow devient une option réellement praticable

L’essentiel du schéma à double structure (ce qui m’a le plus marqué après un mois d’usage)

• L’advisory n’est jamais bloquant — même si Codex signale un problème CRITICAL, le push passe. Dès qu’on le rend bloquant une seule fois, toute la chaîne de travail s’arrête au moindre downtime du modèle, et un seul faux positif suffit pour que les utilisateurs commencent à contourner entièrement le hook avec --no-verify
• On ne remplit pas CLAUDE.md / AGENTS.md avec le même contenu — au rédacteur, on dit « comment construire », au reviewer, « ce qu’il faut suspecter ». Si ça se recoupe à plus de 80 %, c’est le signe que la répartition des rôles ne fonctionne pas vraiment
• codex review --base et codex exec se distinguent selon les use cases — review lit directement git, c’est propre, mais sur les grosses PR les tokens explosent ; avec exec, on injecte soi-même le diff dans le prompt, ce qui permet de mieux contrôler le coût. Au-delà de 100 fichiers modifiés, j’ai tendance à basculer vers exec
• La double ligne de défense secret du hook pre-push — les patterns de fichiers (.env, *.pem, secrets/) provoquent un abort du push, tandis que les regex inline (sk-, ghp_, AKIA…) ne déclenchent qu’un avertissement. Le « never block » de l’advisory est une règle pour la sortie du modèle ; pousser un fichier secret est un incident de sécurité d’une autre nature, et dans ce cas le blocage est la bonne réponse
• Un seul wrapper de graceful degradation absorbe le tout — enveloppe JSON par défaut + --raw Markdown, timeout bash natif, toujours exit 0. L’appelant ne bifurque qu’en regardant le status

Ce qui a changé après un mois d’utilisation

• Le nombre de bugs attrapés juste avant le merge a augmenté. Il arrive assez souvent que Codex pointe une race condition ou un null check manquant précisément là où Claude était très sûr de lui en disant « c’est bien codé »
• Le lendemain d’une PR, rouvrir le code en se disant « attends, pourquoi j’ai fait ça comme ça ? » a quasiment disparu. Comme un autre point de vue est déjà passé une fois, le coût de revue en régression baisse
• La fatigue de l’auto-review, quand on relit son propre code, diminue nettement. L’effet ressemble à celui d’avoir un reviewer humain supplémentaire
• Juste avant des changements difficiles à annuler, comme une migration SQL ou un flux de paiement, le fait qu’un autre modèle y jette encore un coup d’œil est la différence psychologique la plus importante

Structure du curriculum (8 chapitres, 5 parties)

• Part 1, raisonnement pour utiliser deux agents ensemble · 1 chapitre — angles morts d’un agent unique, critères de justification du coût
• Part 2, environnement et contexte · 2 chapitres — setup de base VSCode + Claude Code + Codex CLI, répartition AGENTS.md vs CLAUDE.md
• Part 3, schémas d’automatisation de la review · 3 chapitres — script wrapper advisory, pipeline multiphase en slash commands, automatisation du hook pre-push
• Part 4, guide d’exploitation · 1 chapitre — arbre de décision pour choisir l’outil selon le type de tâche, guide de coût et de modèles, section Security & Privacy
• Part 5, boilerplate · 1 chapitre — un pack de templates wrapper, hook, CLAUDE.md/AGENTS.md réutilisables tels quels dans votre propre repo

Ce que je me suis dit en mettant tout cela au propre

• La vraie valeur d’une structure à deux niveaux, c’est que « les deux outils ne deviennent pas mutuellement des gates ». Si on autorise une seule fois le blocage, le travail s’arrête au moindre incident d’un côté ; et au premier faux positif, les utilisateurs commencent à contourner complètement le hook, ce qui le vide de toute efficacité
• Plus les outils d’IA accélèrent, plus j’ai l’impression que la variable décisive n’est pas « quel outil utiliser », mais « comment superposer les angles morts de plusieurs outils pour les couvrir ». C’est la même logique que lorsqu’on demande une review de code à plus d’une personne
• Je partage cela en pensant que ça pourra être utile à celles et ceux qui, en travaillant avec des outils de coding IA, ne sont pas totalement rassurés à l’idée de relire eux-mêmes leur propre code, ou qui repoussent encore la décision d’installer ensemble Claude Code et Codex. Si j’ai mal compris ou mal formulé certains points, n’hésitez pas à me le signaler en commentaire et je corrigerai.

Faire coder serré à Claude et faire râler Codex — un schéma de terrain pour répartir deux agents sur le même repo

À lire aussi

Aucun commentaire pour le moment.