- Environnement de développement intégré pour l’IA permettant de gérer plusieurs agents IA simultanément, avec prise en charge du travail en parallèle et de la collaboration de longue durée
- Chaque agent s’exécute dans un thread indépendant, ce qui permet le multitâche par projet, la revue de code, les commentaires sur les diff et les modifications manuelles
- La fonctionnalité Skills étend l’usage au-delà de l’écriture de code vers la collecte d’informations, la résolution de problèmes, la génération d’images, la rédaction de documents, le déploiement cloud, etc.
- La fonctionnalité Automations permet d’exécuter automatiquement des tâches répétitives en arrière-plan selon un calendrier défini
- La sécurité par sandbox est appliquée par défaut, et les commandes nécessitant des privilèges élevés, comme l’accès réseau, requièrent l’approbation de l’utilisateur
- Codex est aussi proposé temporairement aux utilisateurs de ChatGPT Free et Go, tandis que les offres payantes voient leur limite d’usage doublée
Présentation de l’application Codex : un centre de commande pour les agents
- Depuis le lancement de Codex en avril 2025, la manière dont les développeurs utilisent les agents a changé en profondeur
- Les modèles sont désormais capables de prendre en charge des tâches complexes et de longue durée du début à la fin
- Les développeurs peuvent maintenant orchestrer plusieurs agents à l’échelle d’un projet entier, leur déléguer des tâches et les exécuter en parallèle
- L’enjeu central est passé de « ce que les agents peuvent faire » à « comment les humains peuvent diriger, superviser et faire collaborer des agents à grande échelle »
- Les IDE existants et les outils en ligne de commande n’ont pas été conçus pour prendre en charge cette manière de travailler, d’où le besoin d’un nouvel outil
- L’application Codex pour macOS permet de gérer plusieurs agents IA en même temps et de lancer des tâches en parallèle
- Elle prend en charge les tâches de longue durée et permet, grâce à la collaboration entre agents, de gérer l’ensemble du cycle de conception, développement, déploiement et maintenance logicielle
Travail parallèle multi-agents
- L’application Codex fournit un espace dédié au multitâche avec des agents
- Les agents s’exécutent dans des threads séparés configurés par projet, ce qui permet de passer d’une tâche à l’autre sans perte de contexte
- Dans chaque thread, il est possible d’examiner les modifications de l’agent, de commenter les diff ou de modifier directement dans l’éditeur
- La prise en charge native des worktrees permet à plusieurs agents de travailler sur le même dépôt sans conflit
- Chaque agent travaille sur une copie isolée du code, ce qui permet d’explorer différentes pistes sans affecter l’état local de git
- Il est possible de checkout localement les changements d’un agent en cours de travail, ou de le laisser continuer sans modifier l’état git local
- L’historique des sessions et les paramètres sont importés automatiquement depuis Codex CLI et l’extension IDE, ce qui permet de l’utiliser immédiatement sur les projets existants
Skills : au-delà de la génération de code
- Codex évolue d’un agent qui écrit du code vers un agent qui utilise le code pour effectuer des tâches sur l’ordinateur
- Les Skills permettent d’étendre ses capacités au-delà de la génération de code vers la collecte et la synthèse d’informations, la résolution de problèmes, la rédaction, etc.
- Elles regroupent des instructions, des ressources et des scripts afin que Codex puisse se connecter à des outils et exécuter des workflows
- Les tâches peuvent ainsi être menées à bien de manière fiable selon les préférences de l’équipe
- L’application Codex inclut une interface dédiée à la création et à la gestion des Skills
- Il est possible de demander explicitement l’usage de certaines Skills ou de les activer automatiquement selon la tâche
-
Exemple d’usage des Skills : création d’un jeu de course
- Demande faite à Codex de créer un jeu de course avec plusieurs pilotes, 8 cartes et des objets utilisables avec la barre d’espace
- Utilisation d’une Skill de génération d’images (basée sur GPT Image) et d’une Skill de développement de jeux web
- À partir d’un seul prompt initial, Codex a travaillé de manière autonome sur plus de 7 millions de tokens pour finaliser le jeu
- Il a joué les rôles de designer, développeur de jeu et testeur QA, en jouant réellement au jeu pour le valider
- Nom du jeu : Voxel Velocity, un kart racer voxel 3D utilisant Three.js
- Mode course solo (toujours 3 tours, 1 humain contre 7 CPU, 8 circuits disponibles immédiatement)
- Modèle de conduite arcade, système de charge de drift, niveaux de boost (Tier 1 0,7 seconde, Tier 2 1,1 seconde, Tier 3 1,5 seconde)
- 8 personnages, 8 objets, préréglages de difficulté CPU, implémentation de splines IA
-
Principales Skills proposées
- Implement designs : récupère depuis Figma le contexte de design, les assets et les captures d’écran pour les transformer en code UI de production avec une fidélité visuelle 1:1
- Manage projects : tri des bugs, suivi des releases et gestion de la charge d’équipe dans Linear
- Deploy to the cloud : déploiement d’applications web chez les principaux hébergeurs cloud comme Cloudflare, Netlify, Render et Vercel
- Generate images : Skill de génération d’images basée sur GPT Image pour créer et modifier des images destinées à des sites web, maquettes UI, visuels produit ou assets de jeu
- Build with OpenAI APIs : lors du développement avec l’API OpenAI, référence la documentation la plus récente
- Create documents : lecture, création et édition de fichiers PDF, feuilles de calcul et docx (avec prise en charge d’une mise en forme et d’une mise en page professionnelles)
- Toute nouvelle Skill créée dans l’application peut être utilisée depuis l’application, la CLI ou l’extension IDE
- Les Skills peuvent être versionnées dans le dépôt afin d’être partagées avec toute l’équipe
Automations : automatiser les tâches répétitives
- La fonctionnalité Automations permet à Codex d’exécuter automatiquement des tâches en arrière-plan selon un calendrier défini
- Elle se configure en combinant des instructions et, si besoin, des Skills optionnelles
- Une fois la tâche terminée, les résultats sont enregistrés dans une file d’attente de revue pour pouvoir reprendre ensuite si nécessaire
- Exemples d’usage en interne chez OpenAI
- Tri quotidien des issues
- Recherche et résumé des échecs CI
- Génération d’un brief quotidien de release
- Vérification des bugs
Personality : personnaliser le style de travail
- Chaque développeur a ses préférences dans sa manière de travailler avec un agent
- Certains veulent un partenaire concis et orienté exécution
- D’autres préfèrent une interaction plus conversationnelle et empathique
- Codex propose deux personnalités : un style concis et pragmatique, ou un style conversationnel et empathique
- Cela adapte la forme sans modifier les fonctionnalités
- Le réglage se fait via la commande /personality dans l’application, la CLI et l’extension IDE
Sécurité : activée par défaut et configurable
- La sécurité est intégrée dès la conception dans toute la pile d’agents Codex
- Comme Codex CLI, l’application utilise un sandboxing natif, open source et configurable au niveau système
- Configuration par défaut
- Les agents ne peuvent modifier que les fichiers du dossier ou de la branche en cours, et n’ont accès qu’à la recherche web mise en cache
- Les commandes nécessitant des privilèges élevés, comme l’accès réseau, demandent une approbation de l’utilisateur
- Il est possible de définir des règles par projet ou par équipe pour autoriser automatiquement certaines commandes à s’exécuter avec des privilèges élevés
Disponibilité et prix
- L’application Codex est disponible dès aujourd’hui sur macOS
- Les abonnés ChatGPT Plus, Pro, Business, Enterprise et Edu peuvent utiliser Codex dans la CLI, sur le web, dans l’extension IDE et dans l’application via leur connexion ChatGPT
- L’usage est inclus dans l’abonnement ChatGPT, avec une option d’achat de crédits supplémentaires si nécessaire
- Codex est également proposé à titre temporaire aux utilisateurs de ChatGPT Free et Go
- Pendant cette période, les utilisateurs existants de Codex sur toutes les offres payantes bénéficient d’une limite d’usage doublée
Feuille de route
- Depuis le lancement de GPT-5.2-Codex à la mi-décembre 2024, l’usage global de Codex a doublé
- Au cours du dernier mois, plus d’un million de développeurs ont utilisé Codex
- Prochaines étapes
- Lancement prévu d’une application Windows
- Extension des capacités à la frontière des modèles
- Raisonnement plus rapide
- Améliorations dans l’application
- Amélioration continue des workflows multi-agents sur la base des retours du terrain
- Gestion simplifiée du travail en parallèle et meilleure conservation du contexte lors du passage d’un agent à l’autre
- Extension d’Automations
- Prise en charge en cours de développement de déclencheurs basés sur le cloud
- Codex pourra ainsi continuer à s’exécuter en arrière-plan même lorsque l’ordinateur n’est pas ouvert
Le postulat central de Codex
- Tout repose sur un postulat simple : tout est contrôlé par le code
- Plus un agent est capable de raisonner sur le code et d’en générer, plus il devient compétent pour toutes les formes de travail technique et intellectuel
- L’enjeu central actuel est l’écart entre les capacités des modèles de pointe et la facilité avec laquelle les gens peuvent réellement les utiliser
- Codex a été conçu pour combler cet écart, en permettant de diriger, superviser et appliquer facilement toute l’intelligence du modèle à des tâches concrètes
- L’accent a été mis sur la création du meilleur agent de code, qui servira de base à un agent puissant pour un large éventail de travaux intellectuels au-delà de l’écriture de code
Aucun commentaire pour le moment.