OpenAI a annoncé GPT-5.5, un nouveau modèle plus intelligent et plus intuitif. Ce modèle va au-delà de la simple génération de texte et se concentre sur la maximisation de ses capacités en tant qu’« agent ».
Principales caractéristiques :
- Renforcement des capacités d’agent : la capacité à planifier et exécuter de manière autonome des tâches complexes en plusieurs étapes a été fortement améliorée dans les domaines du code, de l’utilisation de l’ordinateur, du travail de la connaissance et des premières phases de la recherche scientifique.
- Performances et efficacité : GPT-5.5 offre une intelligence nettement supérieure tout en conservant la même latence par token que GPT-5.4. Il utilise également moins de tokens pour accomplir une même tâche.
- Résultats sur les benchmarks : il a obtenu 82,7 % sur Terminal-Bench 2.0 et 58,6 % sur SWE-Bench Pro, démontrant sa capacité à gérer des workflows CLI complexes et à résoudre de vrais tickets GitHub.
- Informations de lancement : le déploiement est en cours par vagues pour les utilisateurs de ChatGPT Plus, Pro, Business, Enterprise ainsi que pour les utilisateurs de Codex, et l’API sera lancée prochainement.
OpenAI souligne que GPT-5.5, au-delà d’un simple outil, deviendra un élément central de l’infrastructure d’« agentic AI », capable de comprendre plus rapidement l’intention de l’utilisateur et d’accomplir lui-même les tâches.
6 commentaires
Même si personne ne l’utilise, je continue à développer avec acharnement ma bibliothèque npm de compagnie, et je suis en train d’en optimiser les performances.
Les hypothèses auxquelles j’avais pensé se sont presque toutes révélées invalides après avoir lancé des benchmarks, donc je vais essayer d’en tirer d’autres pistes d’optimisation des performances avec ça.
J’ai hâte... J’espère qu’ils retrouveront à nouveau leur place de SOTA pour que la concurrence reparte..
Cela fait longtemps qu'il a trouvé sa place au sommet du SOTA..
opus4.6...
Affirmer que Codex n'est pas à l'état de l'art, c'est quelque chose que seuls peuvent dire ceux qui ne l'ont pas essayé ou qui ne s'intéressent pas à ce domaine.
Je suis d’accord lol