7 points par GN⁺ 14 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • OpenAI a fortement mis à jour Agents SDK afin de fournir une infrastructure standardisée permettant aux agents d’effectuer l’inspection de fichiers, l’exécution de commandes, l’édition de code et les tâches de longue durée dans un environnement sandbox contrôlé
  • Le nouveau harness intègre des primitives clés des systèmes d’agents de pointe : mémoire configurable, orchestration compatible sandbox, outils de système de fichiers de style Codex, ainsi que MCP, skills, AGENTS.md, shell, apply patch, etc.
  • Grâce à la prise en charge native de l’exécution en sandbox, il prend en charge nativement divers fournisseurs de sandbox comme Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop et Vercel, avec la possibilité de connecter aussi sa propre sandbox
  • Avec une architecture séparant harness et calcul, il renforce la défense contre le prompt injection, l’exécution durable basée sur des snapshots et la parallélisation multi-conteneurs pour la sécurité et la montée en charge
  • Disponible en disponibilité générale (GA) pour tous les clients avec une facturation standard basée sur les tokens et l’usage des outils via l’API ; la prise en charge de TypeScript ainsi que les fonctions code mode et subagents sont prévues ultérieurement

Limites des systèmes d’agents existants

  • Pour construire un agent utile, les développeurs ont besoin non seulement des meilleurs modèles, mais aussi d’un système capable de prendre en charge l’inspection de fichiers, l’exécution de commandes, l’écriture de code et le maintien de tâches multi-étapes
  • Les compromis des approches existantes
    • Les frameworks indépendants du modèle sont flexibles, mais n’exploitent pas pleinement les capacités des modèles de pointe
    • Les SDK des fournisseurs de modèles sont plus proches des modèles, mais offrent souvent une visibilité insuffisante sur le harness
    • Les API d’agents managées simplifient le déploiement, mais limitent l’endroit où les agents s’exécutent et la manière dont ils accèdent aux données sensibles

Un harness plus puissant pour la boucle agentique

  • Avec cette publication, le harness d’Agents SDK offre des capacités renforcées aux agents qui manipulent des documents, des fichiers et des systèmes
  • Principales primitives désormais intégrées
    • Utilisation d’outils via MCP
    • Progressive disclosure via skills
    • Instructions personnalisées via AGENTS.md
    • Exécution de code via l’outil shell
    • Édition de fichiers via l’outil apply patch
  • Comme le harness continuera à intégrer au fil du temps de nouveaux patterns agentiques et primitives, les développeurs pourront se concentrer sur la logique métier plutôt que sur les mises à jour de l’infrastructure de base
  • Le harness améliore la stabilité et les performances en alignant l’exécution sur la manière dont les modèles de pointe donnent leurs meilleurs résultats, en particulier pour les tâches de longue durée ou les travaux complexes nécessitant une coordination entre divers outils et systèmes
  • Conçu pour prendre en charge les besoins spécifiques de chaque produit, il permet d’adapter avec souplesse l’usage des outils, la mémoire et l’environnement sandbox à la stack existante du développeur

Exécution native en sandbox

  • Le nouvel Agents SDK prend nativement en charge l’exécution en sandbox, permettant aux agents de s’exécuter dans un environnement informatique contrôlé doté des fichiers, outils et dépendances nécessaires au travail
  • De nombreux agents utiles ont besoin d’un workspace capable de lire/écrire des fichiers, d’installer des dépendances, d’exécuter du code et d’utiliser des outils en toute sécurité ; la prise en charge native de la sandbox fournit cela par défaut, sans configuration séparée
  • Il est possible d’utiliser sa propre sandbox ou de tirer parti du support intégré pour Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop et Vercel
  • Introduction d’une abstraction Manifest pour rendre les environnements portables entre plusieurs fournisseurs
    • Possibilité de monter des fichiers locaux et de définir des répertoires de sortie
    • Prise en charge de l’import de données depuis des fournisseurs de stockage comme AWS S3, Google Cloud Storage, Azure Blob Storage et Cloudflare R2
  • Fournit aux développeurs une méthode cohérente de configuration des environnements, du prototypage local jusqu’au déploiement en production
  • Offre au modèle un workspace prévisible concernant l’emplacement des entrées, des sorties et la façon d’organiser le travail pendant les tâches longues

Sécurité, durabilité et montée en charge grâce à la séparation entre harness et calcul

  • Les systèmes d’agents doivent être conçus en partant du principe qu’il y aura des tentatives de prompt injection et d’exfiltration de données, et la séparation entre harness et calcul aide à isoler les identifiants de l’environnement où s’exécute le code généré par le modèle
  • Prise en charge de l’exécution durable (durable execution)
    • Lorsque l’état de l’agent est externalisé, la perte d’un conteneur sandbox n’entraîne pas la perte de l’exécution
    • Grâce aux snapshots et à la réhydratation intégrés, si l’environnement d’origine échoue ou expire, il est possible de restaurer l’état depuis le dernier checkpoint dans un nouveau conteneur et de reprendre l’exécution
  • Renforcement de la montée en charge
    • L’exécution de l’agent peut utiliser un ou plusieurs sandboxes
    • Les sandboxes peuvent n’être appelées qu’en cas de besoin, et les subagents peuvent être routés vers des environnements isolés
    • La parallélisation multi-conteneurs permet une exécution plus rapide

Cas client : Oscar Health

  • Selon Rachael Burns, Staff Engineer & AI Tech Lead chez Oscar Health, le nouvel Agents SDK a permis de mettre en production un niveau d’automatisation des workflows de dossiers cliniques qui n’était pas suffisamment fiable avec l’approche précédente
  • Le point différenciant clé n’est pas une simple extraction de métadonnées, mais la capacité à comprendre précisément chaque limite de consultation (encounter boundary) dans des dossiers longs et complexes
  • Résultat : une compréhension plus rapide du contexte de visite de chaque patient, contribuant à améliorer les soins et l’expérience patient

Tarification et disponibilité

  • Les nouvelles fonctions d’Agents SDK sont disponibles en GA pour tous les clients via l’API
  • Application de la tarification API standard (facturation basée sur les tokens et l’usage des outils)

Feuille de route

  • OpenAI continuera de faire évoluer Agents SDK afin de permettre la mise en production d’agents plus puissants avec moins d’infrastructure personnalisée, tout en préservant la flexibilité et le contrôle des développeurs
  • Le nouveau harness et les fonctions sandbox sont lancés d’abord en Python, avec une prise en charge de TypeScript prévue dans une future release
  • Les fonctions code mode et subagents sont en cours d’ajout à la fois pour Python et TypeScript
  • La prise en charge de l’intégration de l’écosystème agentique sera étendue avec davantage de fournisseurs de sandbox, d’intégrations et de moyens de connexion aux outils et systèmes déjà utilisés par les développeurs

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.