- Vidéo du webinaire de formation Codex pour développeurs publiée directement par OpenAI (58 min)
- Codex est une plateforme d’agents de codage conçue pour aller au-delà de l’autocomplétion de code ou du pair programming, afin que les ingénieurs puissent déléguer des tâches de grande ampleur à des agents
- L’app Codex, le CLI, les extensions IDE et d’autres interfaces partagent le même backend, avec la possibilité d’exécuter plusieurs tâches en parallèle
- Couvre l’ensemble du cycle de vie du développement logiciel (SDLC), de la planification (Plan), la conception (Design), la construction (Build), les tests (Test), la revue (Review), la documentation (Document), jusqu’au déploiement et à la maintenance (Deploy & Maintenance)
- Le fichier agents.md permet de définir au niveau du dépôt les consignes de comportement des agents, tandis que Skills et Automations permettent d’empaqueter des workflows répétitifs pour les exécuter automatiquement
- Possibilité de travailler sans interruption pendant 25 heures et de conserver un contexte sur la durée grâce à 13 à 14 compactions côté serveur (server-side compaction), avec une sécurité assurée par un sandbox au niveau de l’OS
L’évolution du coding IA : de l’autocomplétion à la délégation à des agents
- Ces dernières années, le coding IA a évolué de l’autocomplétion de code (environ 10 % de gain de vitesse de frappe) vers le pair programming (planification entre fichiers, exécution de tests, modification du dépôt)
- Ces deux approches visaient surtout à créer un « meilleur collaborateur », mais Codex a commencé à être développé il y a un an avec pour objectif de bâtir des agents auxquels on peut déléguer
- En décembre 2025, le modèle GT 5.2 Codex a levé les principaux freins à une « véritable délégation à des agents » en assurant un travail prolongé sans interruption et un haut niveau de steerability
- Les performances ont ensuite continué à progresser avec GT 5.3, plus rapide et plus efficace, puis avec le tout dernier modèle GT 5.4
- Le point clé de cette avancée est la capacité à naviguer de manière fiable dans de vastes codebases d’entreprise et à rester aligné longtemps sur l’intention de l’utilisateur
Interfaces disponibles pour Codex
- Codex permet d’utiliser un même agent via plusieurs surfaces — CLI, extension IDE, app Codex — qui partagent toutes le même backend
- L’app Codex est l’interface la plus visuelle pour l’exécution parallèle de tâches, optimisée pour lancer plusieurs agents à la fois et examiner leurs résultats
- Cas cité de Peter Steinberger (fondateur d’OpenClaw) : il est passé d’une gestion de plus de 10 fenêtres CLI à l’app Codex, améliorant ainsi l’efficacité de la gestion parallèle d’agents
- Disponible sur macOS et Windows, téléchargeable sur openai.com/codex, avec aussi une version Windows sur le Microsoft Store
- Dans le CLI, la connexion initiale se fait avec la commande
codex login, puis la session démarre avec codex
Interface de l’app Codex et réglages
- Possibilité de choisir le modèle (GPT 5.4, etc.) et de régler le niveau d’effort de raisonnement (reasoning effort) : low, medium, high, extra high
medium est la valeur par défaut, offrant le meilleur équilibre entre vitesse et profondeur de raisonnement
low convient aux questions simples, tandis que high ou extra high sont adaptés aux tâches nécessitant une réflexion approfondie sur la durée
- Le mode Speed (fast/standard) permet aussi d’ajuster la vitesse de réponse
- En plus du travail local, l’application propose un mode Git worktree et une option de démarrage de conteneur cloud distant
- Réglages d’autorisations : choix entre des permissions par défaut (lecture/édition des fichiers du projet, demande d’approbation pour les commandes risquées) et un accès complet (tous les fichiers de l’ordinateur, accès réseau, exécution sans approbation)
- Les permissions par défaut sont recommandées aux nouveaux utilisateurs
- Dans la barre latérale gauche, on peut ajouter et basculer entre plusieurs projets (dossiers)
Utilisation de Codex à toutes les étapes du SDLC
- OpenAI a publié le guide « Building an AI Native Engineering Team », qui explique comment les agents de codage accélèrent l’ensemble des 7 étapes du SDLC (planification, conception, build, test, review, documentation, déploiement/maintenance)
- Les étapes de test et de review deviennent particulièrement importantes à mesure que les capacités de génération de code progressent
- Codex est particulièrement bien évalué pour son raisonnement dans des codebases complexes et pour l’écriture de code de niveau production
Étape de planification (Plan)
- En activant le mode Plan (
/plan ou Shift+Tab), Codex élabore d’abord un plan avant l’implémentation
- Dans la démo, lorsqu’on lui demande le plan d’une app compagnon iOS en SwiftUI, Codex explore la codebase puis pose des questions de suivi (méthode d’authentification, périmètre de la première release, etc.)
- Il est possible d’ajuster l’agent en acceptant les options proposées ou en saisissant directement ses propres consignes
- Le plan explicite aussi ses hypothèses (assumptions), afin que l’utilisateur puisse les vérifier et les corriger
Étape de conception (Design) — intégration MCP
- Grâce au MCP (Model Context Protocol), Codex peut connecter directement le contexte d’outils externes comme Figma ou Linear
- Pris en charge dans toutes les interfaces : CLI, extension IDE et app Codex
- Avec l’intégration Figma MCP, il suffit de coller un lien de design pour que Codex récupère le contexte et le transforme en code
- Si MCP n’est pas configuré, Codex affiche automatiquement les instructions d’installation
- L’intégration à l’app ChatGPT est également utilisable directement dans Codex via une intégration réalisée par un tiers
- Cela permet aux ingénieurs de se concentrer sur la logique métier, tandis que les designers peuvent consacrer plus de temps à explorer différents concepts de design
Étape de build (Build)
- C’est l’étape du SDLC où l’impact des agents de codage est le plus fort
- Dans la démo, plusieurs tâches sont exécutées en parallèle : correction d’une inefficacité de type N+1 query et ajout de tests de régression, audit d’une route API sans authentification, migration de NextAuth v4 vers Auth.js v5, etc.
- Résultat de génération de code à partir d’un design Figma : modifications sur 10 fichiers, 320 lignes de code écrites, sans travail manuel sur le CSS
- La fonctionnalité Worktree crée automatiquement une copie du projet local afin d’éviter les conflits entre tâches parallèles, sans devoir dupliquer le dépôt séparément
- Codex exécute automatiquement les commandes de validation, de build et de lint définies dans
agents.md, comme npx tsc ou npm test, pour vérifier le respect des conventions de l’équipe
- Le build lui-même n’est plus le goulet d’étranglement ; dans les environnements d’entreprise, l’enjeu principal est surtout de vérifier que le code respecte les règles de l’équipe
- Le terminal peut être ouvert directement dans l’application avec Command+J
- Même pour une app iOS, il est possible d’exécuter
xcode build dans l’app Codex sans ouvrir Xcode directement
Slash Commands
- Le CLI, l’extension IDE et l’app Codex prennent tous en charge les slash commands : mode plan, mention de fichiers, vérification de l’état de la session, modification des permissions, etc.
- La commande
/experimental permet d’activer ou désactiver des fonctionnalités expérimentales
- Elle inclut notamment la création de multi-agents (sub-agents)
- Le CLI reçoit généralement les nouvelles fonctionnalités un peu avant les autres interfaces
- Comme toutes les interfaces partagent le même backend, les réglages activés depuis une interface sont répercutés sur toutes les autres
Étape de review (Review)
- La commande
/review lance une revue de code par rapport à la branche de base ou aux modifications locales non commit
- Les agents Codex sont entraînés spécifiquement à identifier des bugs de niveau P0/P1, avec des retours à fort signal et peu de bruit
- Cela permet de détecter les problèmes localement et plus tôt, avant que la PR n’atteigne la pipeline CI/CD
- Intégration native GitHub Cloud : Codex peut effectuer automatiquement des revues de code de PR, de manière proactive ou réactive
- Un exemple cité montre la détection d’un problème P1 qu’un humain aurait pu manquer, dans une revue de règles regex
- Pour d’autres SCM comme GitLab ou Bitbucket, l’intégration peut être construite directement via le Codex SDK
- Si l’on ajoute directement des commentaires de review dans le panneau diff, ils sont automatiquement pris en compte comme contexte pour la conversation suivante
Skills — empaqueter des workflows réutilisables
- Un Skill est un standard ouvert permettant d’empaqueter des consignes de workflow réutilisables que Codex pourra exécuter
- Structurellement, il s’agit d’un dossier dont le fichier obligatoire est skill.md (métadonnées + consignes pour l’agent)
- On peut aussi y ajouter de manière optionnelle des scripts d’exécution, de la documentation ou des templates
- Il est également possible d’embarquer MCP dans un skill pour l’intégrer à des outils externes
- Exemples montrés dans la démo : traitement des commentaires de PR, correction automatique d’échecs de build BuildKite, détection de dead code
- Skill Creator (skill système) : pendant une conversation, une demande comme « create a skill to find dead code paths » génère automatiquement le squelette du
skill.md
- Skill Installer (skill système) : installe immédiatement le skill généré dans le répertoire local des skills Codex
- Après une longue conversation, un workflow appelé à se répéter peut être transformé en skill afin de pouvoir ensuite exécuter l’ensemble du workflow en un seul appel
- Exemple du skill GitHub Issue Plan PR : avec un seul prompt, il enchaîne le triage d’une issue GitHub, la planification, l’édition, la documentation et la création d’une draft PR, couvrant ainsi toutes les étapes du SDLC d’un seul coup
Étape de documentation (Documentation)
- C’est l’un des usages les plus sous-estimés de Codex
- Il peut générer des diagrammes système et mettre automatiquement à jour la documentation lors de l’implémentation de fonctionnalités
- Une démo montre aussi l’intégration à Linear MCP pour documenter automatiquement dans un board Linear les corrections d’un ticket, les résultats des tests de régression et les vérifications effectuées
Déploiement et maintenance (Deploy & Maintenance)
- Depuis l’app Codex, on peut lancer directement Commit, Push et création de PR en cliquant sur des boutons (sur base Git)
- En collant une stack trace, Codex raisonne sur l’ensemble de la codebase pour identifier l’origine du problème
- Skill Triage Page : en entrant un identifiant d’incident, il collecte les détails, vérifie l’incident, inspecte les métriques et les logs, et va jusqu’au patch en un seul flux
- La réponse aux alertes de type pager duty passe ainsi d’une analyse manuelle des logs à une délégation à des agents
- Skill PR Babysitter : surveille en continu la progression de la pipeline CI/CD d’une PR, corrige automatiquement les problèmes si nécessaire, puis termine jusqu’au merge automatiquement
- Déjà utilisé concrètement chez OpenAI dans un environnement de monorepo à grande échelle
- Téléchargeable depuis le dépôt open source de skills
Automations — exécution automatique planifiée
- Une fois familiarisé avec les skills, on peut utiliser Automations pour programmer l’exécution automatique de tâches à des horaires précis
- Automatisation d’un skill Sentry : chaque jeudi (ou tous les jours), recherche les problèmes d’un dépôt donné, puis propose un correctif ou le corrige automatiquement
- Automatisation « What is everyone up to? » : chaque jour à 9 h, génère un résumé de l’activité des membres de l’équipe dans le dépôt
- Sans même saisir de prompt manuellement, Codex continue ainsi à travailler en arrière-plan
Comment fonctionnent les agents Codex
- Les agents Codex fonctionnent en boucle : l’utilisateur fournit un objectif clair et une direction initiale, puis l’agent enchaîne raisonnement, appel d’outils, lecture de fichiers, recherche dans le dépôt, écriture de code et exécution de commandes
- Le résultat de chaque outil est réinjecté dans l’appel de modèle suivant, ce qui permet de construire progressivement la compréhension et l’avancement
- Le contexte (context) est la variable clé qui détermine les performances de l’agent : il est essentiel de lui donner la bonne quantité d’entrée pour l’orienter correctement
- Sandboxing au niveau de l’OS : plutôt que de simples restrictions légères au niveau du harness, le contrôle des accès réseau et fichiers se fait au niveau du système d’exploitation
- Un choix de conception pensé pour anticiper la possibilité que des modèles plus avancés contournent des protections légères
- Le sandbox est pris en charge sur tous les systèmes (Mac, Windows), avec sur Windows une sandbox native Windows plus sécurisée que WSL
- Le fichier de configuration TOML permet d’affiner les réglages de approval mode (moment de l’approbation) et de sandbox mode (périmètre d’accès)
- La valeur par défaut est
on request, c’est-à-dire une exécution normale jusqu’au moment où une élévation de privilèges devient nécessaire
Compaction — gestion des fils longs
- Quand la conversation approche de la limite de contexte du modèle, Codex effectue une compaction qui compresse les premières parties de l’échange
- La compaction est réalisée côté serveur, à partir de la chaîne de pensée brute (chain of thought), ce qui permet de mieux préserver le contenu réel du travail qu’une approche côté client
- Cas réel cité : 25 heures de travail ininterrompu avec 13 à 14 compactions tout en conservant le contexte
Bonnes pratiques de prompting pour une délégation efficace
- Avec un prompt minimal, il faut tout de même inclure un objectif clair, les contraintes et la définition de « terminé »
- Intégrer les conditions de validation dans le prompt : critères de réussite, tests à exécuter, commandes de build à lancer
- Utiliser des prompts ouverts : demander à Codex des idées d’amélioration des performances ou des zones manquant de couverture de test afin de l’utiliser comme partenaire de réflexion
agents.md — fichier d’instructions de comportement des agents
- C’est un format ouvert comparable aux Rules de Cursor ou aux réglages de Windsurf, et non une exclusivité OpenAI
- Il est chargé automatiquement dans toutes les sessions Codex et contribue à produire des résultats cohérents
- Système de priorité en 3 niveaux :
- global (
~/.codex/agents.md) : préférences personnelles par défaut (indépendantes de l’équipe)
- racine du dépôt (
agents.md) : conventions valables pour tout le dépôt
- sous-répertoire (
agents.md) : consignes détaillées propres à un microservice ou à un sous-dossier
- Codex concatène les fichiers agents.md le long du chemin depuis la racine du projet jusqu’au répertoire courant, en donnant priorité aux fichiers les plus spécifiques
- Éléments recommandés : aperçu du dépôt, commandes à exécuter, attentes en matière de tests, emplacement des modules clés, consignes pour les commits et les PR
- La commande
/init (CLI) permet de générer automatiquement un premier agents.md, ce qui réduit le problème du cold start
- Il est recommandé de rester concis, idéalement sous les 100 lignes (référence : les
agents.md de monorepos internes chez OpenAI)
- Si le contenu devient trop long, il vaut mieux le répartir dans des fichiers Markdown par tâche (
planning.md, code-review.md, architecture.md, etc.) et les référencer depuis agents.md
- Un pattern d’automatisation présenté consiste à demander à Codex d’analyser les logs de session locaux (avec le chemin de stockage fourni) pour proposer automatiquement chaque semaine des améliorations à
agents.md
- On peut aussi demander à Codex une rétrospective de conversation afin d’ajouter automatiquement dans
agents.md une section gotchas ou des notes de référence
Conclusion — 3 actions clés pour adopter Codex
- Créer un
agents.md et configurer des réglages personnalisés
- Confier de vraies tâches métier à Codex et le connecter aux outils (MCP) utilisés au quotidien
- Faire tourner Codex non seulement au build, mais dans toute la boucle de développement, de la conception jusqu’au déploiement et à la maintenance
Aucun commentaire pour le moment.