Codex pour les ingénieurs logiciel

(academy.openai.com)

69 points par GN⁺ 2026-03-19 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Vidéo du webinaire de formation Codex pour développeurs publiée directement par OpenAI (58 min)
Codex est une plateforme d’agents de codage conçue pour aller au-delà de l’autocomplétion de code ou du pair programming, afin que les ingénieurs puissent déléguer des tâches de grande ampleur à des agents
L’app Codex, le CLI, les extensions IDE et d’autres interfaces partagent le même backend, avec la possibilité d’exécuter plusieurs tâches en parallèle
Couvre l’ensemble du cycle de vie du développement logiciel (SDLC), de la planification (Plan), la conception (Design), la construction (Build), les tests (Test), la revue (Review), la documentation (Document), jusqu’au déploiement et à la maintenance (Deploy & Maintenance)
Le fichier agents.md permet de définir au niveau du dépôt les consignes de comportement des agents, tandis que Skills et Automations permettent d’empaqueter des workflows répétitifs pour les exécuter automatiquement
Possibilité de travailler sans interruption pendant 25 heures et de conserver un contexte sur la durée grâce à 13 à 14 compactions côté serveur (server-side compaction), avec une sécurité assurée par un sandbox au niveau de l’OS

L’évolution du coding IA : de l’autocomplétion à la délégation à des agents

Ces dernières années, le coding IA a évolué de l’autocomplétion de code (environ 10 % de gain de vitesse de frappe) vers le pair programming (planification entre fichiers, exécution de tests, modification du dépôt)
Ces deux approches visaient surtout à créer un « meilleur collaborateur », mais Codex a commencé à être développé il y a un an avec pour objectif de bâtir des agents auxquels on peut déléguer
En décembre 2025, le modèle GT 5.2 Codex a levé les principaux freins à une « véritable délégation à des agents » en assurant un travail prolongé sans interruption et un haut niveau de steerability
Les performances ont ensuite continué à progresser avec GT 5.3, plus rapide et plus efficace, puis avec le tout dernier modèle GT 5.4
Le point clé de cette avancée est la capacité à naviguer de manière fiable dans de vastes codebases d’entreprise et à rester aligné longtemps sur l’intention de l’utilisateur

Interfaces disponibles pour Codex

Codex permet d’utiliser un même agent via plusieurs surfaces — CLI, extension IDE, app Codex — qui partagent toutes le même backend
L’app Codex est l’interface la plus visuelle pour l’exécution parallèle de tâches, optimisée pour lancer plusieurs agents à la fois et examiner leurs résultats
Cas cité de Peter Steinberger (fondateur d’OpenClaw) : il est passé d’une gestion de plus de 10 fenêtres CLI à l’app Codex, améliorant ainsi l’efficacité de la gestion parallèle d’agents
Disponible sur macOS et Windows, téléchargeable sur openai.com/codex, avec aussi une version Windows sur le Microsoft Store
Dans le CLI, la connexion initiale se fait avec la commande codex login, puis la session démarre avec codex

Interface de l’app Codex et réglages

Possibilité de choisir le modèle (GPT 5.4, etc.) et de régler le niveau d’effort de raisonnement (reasoning effort) : low, medium, high, extra high
- medium est la valeur par défaut, offrant le meilleur équilibre entre vitesse et profondeur de raisonnement
- low convient aux questions simples, tandis que high ou extra high sont adaptés aux tâches nécessitant une réflexion approfondie sur la durée
Le mode Speed (fast/standard) permet aussi d’ajuster la vitesse de réponse
En plus du travail local, l’application propose un mode Git worktree et une option de démarrage de conteneur cloud distant
Réglages d’autorisations : choix entre des permissions par défaut (lecture/édition des fichiers du projet, demande d’approbation pour les commandes risquées) et un accès complet (tous les fichiers de l’ordinateur, accès réseau, exécution sans approbation)
- Les permissions par défaut sont recommandées aux nouveaux utilisateurs
Dans la barre latérale gauche, on peut ajouter et basculer entre plusieurs projets (dossiers)

Utilisation de Codex à toutes les étapes du SDLC

OpenAI a publié le guide « Building an AI Native Engineering Team », qui explique comment les agents de codage accélèrent l’ensemble des 7 étapes du SDLC (planification, conception, build, test, review, documentation, déploiement/maintenance)
Les étapes de test et de review deviennent particulièrement importantes à mesure que les capacités de génération de code progressent
Codex est particulièrement bien évalué pour son raisonnement dans des codebases complexes et pour l’écriture de code de niveau production

Étape de planification (Plan)

En activant le mode Plan (/plan ou Shift+Tab), Codex élabore d’abord un plan avant l’implémentation
Dans la démo, lorsqu’on lui demande le plan d’une app compagnon iOS en SwiftUI, Codex explore la codebase puis pose des questions de suivi (méthode d’authentification, périmètre de la première release, etc.)
Il est possible d’ajuster l’agent en acceptant les options proposées ou en saisissant directement ses propres consignes
Le plan explicite aussi ses hypothèses (assumptions), afin que l’utilisateur puisse les vérifier et les corriger

Étape de conception (Design) — intégration MCP

Grâce au MCP (Model Context Protocol), Codex peut connecter directement le contexte d’outils externes comme Figma ou Linear
- Pris en charge dans toutes les interfaces : CLI, extension IDE et app Codex
Avec l’intégration Figma MCP, il suffit de coller un lien de design pour que Codex récupère le contexte et le transforme en code
- Si MCP n’est pas configuré, Codex affiche automatiquement les instructions d’installation
L’intégration à l’app ChatGPT est également utilisable directement dans Codex via une intégration réalisée par un tiers
Cela permet aux ingénieurs de se concentrer sur la logique métier, tandis que les designers peuvent consacrer plus de temps à explorer différents concepts de design

Étape de build (Build)

C’est l’étape du SDLC où l’impact des agents de codage est le plus fort
Dans la démo, plusieurs tâches sont exécutées en parallèle : correction d’une inefficacité de type N+1 query et ajout de tests de régression, audit d’une route API sans authentification, migration de NextAuth v4 vers Auth.js v5, etc.
Résultat de génération de code à partir d’un design Figma : modifications sur 10 fichiers, 320 lignes de code écrites, sans travail manuel sur le CSS
La fonctionnalité Worktree crée automatiquement une copie du projet local afin d’éviter les conflits entre tâches parallèles, sans devoir dupliquer le dépôt séparément
Codex exécute automatiquement les commandes de validation, de build et de lint définies dans agents.md, comme npx tsc ou npm test, pour vérifier le respect des conventions de l’équipe
Le build lui-même n’est plus le goulet d’étranglement ; dans les environnements d’entreprise, l’enjeu principal est surtout de vérifier que le code respecte les règles de l’équipe
Le terminal peut être ouvert directement dans l’application avec Command+J
Même pour une app iOS, il est possible d’exécuter xcode build dans l’app Codex sans ouvrir Xcode directement

Slash Commands

Le CLI, l’extension IDE et l’app Codex prennent tous en charge les slash commands : mode plan, mention de fichiers, vérification de l’état de la session, modification des permissions, etc.
La commande /experimental permet d’activer ou désactiver des fonctionnalités expérimentales
- Elle inclut notamment la création de multi-agents (sub-agents)
- Le CLI reçoit généralement les nouvelles fonctionnalités un peu avant les autres interfaces
Comme toutes les interfaces partagent le même backend, les réglages activés depuis une interface sont répercutés sur toutes les autres

Étape de review (Review)

La commande /review lance une revue de code par rapport à la branche de base ou aux modifications locales non commit
Les agents Codex sont entraînés spécifiquement à identifier des bugs de niveau P0/P1, avec des retours à fort signal et peu de bruit
Cela permet de détecter les problèmes localement et plus tôt, avant que la PR n’atteigne la pipeline CI/CD
Intégration native GitHub Cloud : Codex peut effectuer automatiquement des revues de code de PR, de manière proactive ou réactive
- Un exemple cité montre la détection d’un problème P1 qu’un humain aurait pu manquer, dans une revue de règles regex
Pour d’autres SCM comme GitLab ou Bitbucket, l’intégration peut être construite directement via le Codex SDK
Si l’on ajoute directement des commentaires de review dans le panneau diff, ils sont automatiquement pris en compte comme contexte pour la conversation suivante

Skills — empaqueter des workflows réutilisables

Un Skill est un standard ouvert permettant d’empaqueter des consignes de workflow réutilisables que Codex pourra exécuter
- Structurellement, il s’agit d’un dossier dont le fichier obligatoire est skill.md (métadonnées + consignes pour l’agent)
- On peut aussi y ajouter de manière optionnelle des scripts d’exécution, de la documentation ou des templates
Il est également possible d’embarquer MCP dans un skill pour l’intégrer à des outils externes
Exemples montrés dans la démo : traitement des commentaires de PR, correction automatique d’échecs de build BuildKite, détection de dead code
Skill Creator (skill système) : pendant une conversation, une demande comme « create a skill to find dead code paths » génère automatiquement le squelette du skill.md
Skill Installer (skill système) : installe immédiatement le skill généré dans le répertoire local des skills Codex
Après une longue conversation, un workflow appelé à se répéter peut être transformé en skill afin de pouvoir ensuite exécuter l’ensemble du workflow en un seul appel
Exemple du skill GitHub Issue Plan PR : avec un seul prompt, il enchaîne le triage d’une issue GitHub, la planification, l’édition, la documentation et la création d’une draft PR, couvrant ainsi toutes les étapes du SDLC d’un seul coup

Étape de documentation (Documentation)

C’est l’un des usages les plus sous-estimés de Codex
Il peut générer des diagrammes système et mettre automatiquement à jour la documentation lors de l’implémentation de fonctionnalités
Une démo montre aussi l’intégration à Linear MCP pour documenter automatiquement dans un board Linear les corrections d’un ticket, les résultats des tests de régression et les vérifications effectuées

Déploiement et maintenance (Deploy & Maintenance)

Depuis l’app Codex, on peut lancer directement Commit, Push et création de PR en cliquant sur des boutons (sur base Git)
En collant une stack trace, Codex raisonne sur l’ensemble de la codebase pour identifier l’origine du problème
Skill Triage Page : en entrant un identifiant d’incident, il collecte les détails, vérifie l’incident, inspecte les métriques et les logs, et va jusqu’au patch en un seul flux
- La réponse aux alertes de type pager duty passe ainsi d’une analyse manuelle des logs à une délégation à des agents
Skill PR Babysitter : surveille en continu la progression de la pipeline CI/CD d’une PR, corrige automatiquement les problèmes si nécessaire, puis termine jusqu’au merge automatiquement
- Déjà utilisé concrètement chez OpenAI dans un environnement de monorepo à grande échelle
- Téléchargeable depuis le dépôt open source de skills

Automations — exécution automatique planifiée

Une fois familiarisé avec les skills, on peut utiliser Automations pour programmer l’exécution automatique de tâches à des horaires précis
Automatisation d’un skill Sentry : chaque jeudi (ou tous les jours), recherche les problèmes d’un dépôt donné, puis propose un correctif ou le corrige automatiquement
Automatisation « What is everyone up to? » : chaque jour à 9 h, génère un résumé de l’activité des membres de l’équipe dans le dépôt
Sans même saisir de prompt manuellement, Codex continue ainsi à travailler en arrière-plan

Comment fonctionnent les agents Codex

Les agents Codex fonctionnent en boucle : l’utilisateur fournit un objectif clair et une direction initiale, puis l’agent enchaîne raisonnement, appel d’outils, lecture de fichiers, recherche dans le dépôt, écriture de code et exécution de commandes
Le résultat de chaque outil est réinjecté dans l’appel de modèle suivant, ce qui permet de construire progressivement la compréhension et l’avancement
Le contexte (context) est la variable clé qui détermine les performances de l’agent : il est essentiel de lui donner la bonne quantité d’entrée pour l’orienter correctement
Sandboxing au niveau de l’OS : plutôt que de simples restrictions légères au niveau du harness, le contrôle des accès réseau et fichiers se fait au niveau du système d’exploitation
- Un choix de conception pensé pour anticiper la possibilité que des modèles plus avancés contournent des protections légères
- Le sandbox est pris en charge sur tous les systèmes (Mac, Windows), avec sur Windows une sandbox native Windows plus sécurisée que WSL
Le fichier de configuration TOML permet d’affiner les réglages de approval mode (moment de l’approbation) et de sandbox mode (périmètre d’accès)
- La valeur par défaut est on request, c’est-à-dire une exécution normale jusqu’au moment où une élévation de privilèges devient nécessaire

Compaction — gestion des fils longs

Quand la conversation approche de la limite de contexte du modèle, Codex effectue une compaction qui compresse les premières parties de l’échange
La compaction est réalisée côté serveur, à partir de la chaîne de pensée brute (chain of thought), ce qui permet de mieux préserver le contenu réel du travail qu’une approche côté client
Cas réel cité : 25 heures de travail ininterrompu avec 13 à 14 compactions tout en conservant le contexte

Bonnes pratiques de prompting pour une délégation efficace

Avec un prompt minimal, il faut tout de même inclure un objectif clair, les contraintes et la définition de « terminé »
Intégrer les conditions de validation dans le prompt : critères de réussite, tests à exécuter, commandes de build à lancer
Utiliser des prompts ouverts : demander à Codex des idées d’amélioration des performances ou des zones manquant de couverture de test afin de l’utiliser comme partenaire de réflexion

agents.md — fichier d’instructions de comportement des agents

C’est un format ouvert comparable aux Rules de Cursor ou aux réglages de Windsurf, et non une exclusivité OpenAI
Il est chargé automatiquement dans toutes les sessions Codex et contribue à produire des résultats cohérents
Système de priorité en 3 niveaux :
- global (~/.codex/agents.md) : préférences personnelles par défaut (indépendantes de l’équipe)
- racine du dépôt (agents.md) : conventions valables pour tout le dépôt
- sous-répertoire (agents.md) : consignes détaillées propres à un microservice ou à un sous-dossier
- Codex concatène les fichiers agents.md le long du chemin depuis la racine du projet jusqu’au répertoire courant, en donnant priorité aux fichiers les plus spécifiques
Éléments recommandés : aperçu du dépôt, commandes à exécuter, attentes en matière de tests, emplacement des modules clés, consignes pour les commits et les PR
La commande /init (CLI) permet de générer automatiquement un premier agents.md, ce qui réduit le problème du cold start
Il est recommandé de rester concis, idéalement sous les 100 lignes (référence : les agents.md de monorepos internes chez OpenAI)
Si le contenu devient trop long, il vaut mieux le répartir dans des fichiers Markdown par tâche (planning.md, code-review.md, architecture.md, etc.) et les référencer depuis agents.md
Un pattern d’automatisation présenté consiste à demander à Codex d’analyser les logs de session locaux (avec le chemin de stockage fourni) pour proposer automatiquement chaque semaine des améliorations à agents.md
On peut aussi demander à Codex une rétrospective de conversation afin d’ajouter automatiquement dans agents.md une section gotchas ou des notes de référence

Conclusion — 3 actions clés pour adopter Codex

Créer un agents.md et configurer des réglages personnalisés
Confier de vraies tâches métier à Codex et le connecter aux outils (MCP) utilisés au quotidien
Faire tourner Codex non seulement au build, mais dans toute la boucle de développement, de la conception jusqu’au déploiement et à la maintenance

Codex pour les ingénieurs logiciel

L’évolution du coding IA : de l’autocomplétion à la délégation à des agents

Interfaces disponibles pour Codex

Interface de l’app Codex et réglages

Utilisation de Codex à toutes les étapes du SDLC

Étape de planification (Plan)

Étape de conception (Design) — intégration MCP

Étape de build (Build)

Slash Commands

Étape de review (Review)

Skills — empaqueter des workflows réutilisables

Étape de documentation (Documentation)

Déploiement et maintenance (Deploy & Maintenance)

Automations — exécution automatique planifiée

Comment fonctionnent les agents Codex

Compaction — gestion des fils longs

Bonnes pratiques de prompting pour une délégation efficace

agents.md — fichier d’instructions de comportement des agents

Conclusion — 3 actions clés pour adopter Codex

À lire aussi

Aucun commentaire pour le moment.