La prochaine évolution majeure des Agents SDK

(openai.com)

7 points par GN⁺ 14 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

OpenAI a fortement mis à jour Agents SDK afin de fournir une infrastructure standardisée permettant aux agents d’effectuer l’inspection de fichiers, l’exécution de commandes, l’édition de code et les tâches de longue durée dans un environnement sandbox contrôlé
Le nouveau harness intègre des primitives clés des systèmes d’agents de pointe : mémoire configurable, orchestration compatible sandbox, outils de système de fichiers de style Codex, ainsi que MCP, skills, AGENTS.md, shell, apply patch, etc.
Grâce à la prise en charge native de l’exécution en sandbox, il prend en charge nativement divers fournisseurs de sandbox comme Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop et Vercel, avec la possibilité de connecter aussi sa propre sandbox
Avec une architecture séparant harness et calcul, il renforce la défense contre le prompt injection, l’exécution durable basée sur des snapshots et la parallélisation multi-conteneurs pour la sécurité et la montée en charge
Disponible en disponibilité générale (GA) pour tous les clients avec une facturation standard basée sur les tokens et l’usage des outils via l’API ; la prise en charge de TypeScript ainsi que les fonctions code mode et subagents sont prévues ultérieurement

Limites des systèmes d’agents existants

Pour construire un agent utile, les développeurs ont besoin non seulement des meilleurs modèles, mais aussi d’un système capable de prendre en charge l’inspection de fichiers, l’exécution de commandes, l’écriture de code et le maintien de tâches multi-étapes
Les compromis des approches existantes
- Les frameworks indépendants du modèle sont flexibles, mais n’exploitent pas pleinement les capacités des modèles de pointe
- Les SDK des fournisseurs de modèles sont plus proches des modèles, mais offrent souvent une visibilité insuffisante sur le harness
- Les API d’agents managées simplifient le déploiement, mais limitent l’endroit où les agents s’exécutent et la manière dont ils accèdent aux données sensibles

Un harness plus puissant pour la boucle agentique

Avec cette publication, le harness d’Agents SDK offre des capacités renforcées aux agents qui manipulent des documents, des fichiers et des systèmes
Principales primitives désormais intégrées
- Utilisation d’outils via MCP
- Progressive disclosure via skills
- Instructions personnalisées via AGENTS.md
- Exécution de code via l’outil shell
- Édition de fichiers via l’outil apply patch
Comme le harness continuera à intégrer au fil du temps de nouveaux patterns agentiques et primitives, les développeurs pourront se concentrer sur la logique métier plutôt que sur les mises à jour de l’infrastructure de base
Le harness améliore la stabilité et les performances en alignant l’exécution sur la manière dont les modèles de pointe donnent leurs meilleurs résultats, en particulier pour les tâches de longue durée ou les travaux complexes nécessitant une coordination entre divers outils et systèmes
Conçu pour prendre en charge les besoins spécifiques de chaque produit, il permet d’adapter avec souplesse l’usage des outils, la mémoire et l’environnement sandbox à la stack existante du développeur

Exécution native en sandbox

Le nouvel Agents SDK prend nativement en charge l’exécution en sandbox, permettant aux agents de s’exécuter dans un environnement informatique contrôlé doté des fichiers, outils et dépendances nécessaires au travail
De nombreux agents utiles ont besoin d’un workspace capable de lire/écrire des fichiers, d’installer des dépendances, d’exécuter du code et d’utiliser des outils en toute sécurité ; la prise en charge native de la sandbox fournit cela par défaut, sans configuration séparée
Il est possible d’utiliser sa propre sandbox ou de tirer parti du support intégré pour Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop et Vercel
Introduction d’une abstraction Manifest pour rendre les environnements portables entre plusieurs fournisseurs
- Possibilité de monter des fichiers locaux et de définir des répertoires de sortie
- Prise en charge de l’import de données depuis des fournisseurs de stockage comme AWS S3, Google Cloud Storage, Azure Blob Storage et Cloudflare R2
Fournit aux développeurs une méthode cohérente de configuration des environnements, du prototypage local jusqu’au déploiement en production
Offre au modèle un workspace prévisible concernant l’emplacement des entrées, des sorties et la façon d’organiser le travail pendant les tâches longues

Sécurité, durabilité et montée en charge grâce à la séparation entre harness et calcul

Les systèmes d’agents doivent être conçus en partant du principe qu’il y aura des tentatives de prompt injection et d’exfiltration de données, et la séparation entre harness et calcul aide à isoler les identifiants de l’environnement où s’exécute le code généré par le modèle
Prise en charge de l’exécution durable (durable execution)
- Lorsque l’état de l’agent est externalisé, la perte d’un conteneur sandbox n’entraîne pas la perte de l’exécution
- Grâce aux snapshots et à la réhydratation intégrés, si l’environnement d’origine échoue ou expire, il est possible de restaurer l’état depuis le dernier checkpoint dans un nouveau conteneur et de reprendre l’exécution
Renforcement de la montée en charge
- L’exécution de l’agent peut utiliser un ou plusieurs sandboxes
- Les sandboxes peuvent n’être appelées qu’en cas de besoin, et les subagents peuvent être routés vers des environnements isolés
- La parallélisation multi-conteneurs permet une exécution plus rapide

Cas client : Oscar Health

Selon Rachael Burns, Staff Engineer & AI Tech Lead chez Oscar Health, le nouvel Agents SDK a permis de mettre en production un niveau d’automatisation des workflows de dossiers cliniques qui n’était pas suffisamment fiable avec l’approche précédente
Le point différenciant clé n’est pas une simple extraction de métadonnées, mais la capacité à comprendre précisément chaque limite de consultation (encounter boundary) dans des dossiers longs et complexes
Résultat : une compréhension plus rapide du contexte de visite de chaque patient, contribuant à améliorer les soins et l’expérience patient

Tarification et disponibilité

Les nouvelles fonctions d’Agents SDK sont disponibles en GA pour tous les clients via l’API
Application de la tarification API standard (facturation basée sur les tokens et l’usage des outils)

Feuille de route

OpenAI continuera de faire évoluer Agents SDK afin de permettre la mise en production d’agents plus puissants avec moins d’infrastructure personnalisée, tout en préservant la flexibilité et le contrôle des développeurs
Le nouveau harness et les fonctions sandbox sont lancés d’abord en Python, avec une prise en charge de TypeScript prévue dans une future release
Les fonctions code mode et subagents sont en cours d’ajout à la fois pour Python et TypeScript
La prise en charge de l’intégration de l’écosystème agentique sera étendue avec davantage de fournisseurs de sandbox, d’intégrations et de moyens de connexion aux outils et systèmes déjà utilisés par les développeurs

La prochaine évolution majeure des Agents SDK

Limites des systèmes d’agents existants

Un harness plus puissant pour la boucle agentique

Exécution native en sandbox

Sécurité, durabilité et montée en charge grâce à la séparation entre harness et calcul

Cas client : Oscar Health

Tarification et disponibilité

Feuille de route

À lire aussi

Aucun commentaire pour le moment.