GPT-5.2 et GPT-5.2-Codex sont désormais 40 % plus rapides
(twitter.com/OpenAIDevs)- La vitesse de traitement des modèles GPT-5.2 et GPT-5.2-Codex a été améliorée de 40 % par rapport à auparavant
- Optimisation de la pile d’inférence pour tous les utilisateurs de l’API
- Il s’agit du même modèle et des mêmes poids, mais avec une latence réduite
1 commentaires
Avis sur Hacker News
Au cours du dernier mois, OpenAI a lancé plusieurs fonctionnalités pour les utilisateurs de Codex
Rien qu’avec les deux premières fonctionnalités, j’ai l’impression que ma productivité a triplé. J’attends vraiment cette mise à jour avec impatience
Pendant le week-end, j’ai exécuté le même prompt sur GPT-5.2, Gemini 3 et Grok
Gemini 3 et Grok ont terminé en moins de 2 minutes en « thinking mode », tandis que GPT-5.2 faisait du sur-place pendant 6 minutes
Récemment, roon aurait remarqué que les comptes employés étaient bien plus rapides que ceux des utilisateurs ordinaires
Il aurait alors compris qu’ils pouvaient exécuter les appels à l’API interne de façon plus efficace que pour les utilisateurs classiques
Au final, les utilisateurs ordinaires semblent n’être traités que sur la capacité restante
Article lié : Choose Your Fighter (The Zvi)
À mon avis, OpenAI a l’habitude de dégrader volontairement la qualité après la sortie d’un modèle
La version web de ChatGPT 5.2 était bien meilleure au début, puis la qualité a soudainement chuté après 1 à 2 semaines
Ça ressemblait à une stratégie pour tromper la presse et les benchmarks
Pour accélérer, il suffit simplement de réduire l’intensité du raisonnement, donc j’ai du mal à croire à cette amélioration de 40 %
Ça pourrait aussi être une « entourloupe » du genre donner d’abord le modèle Pro aux utilisateurs ChatGPT Plus, puis le remplacer plus tard par la version Standard
Nous maintenons une qualité de modèle constante, et si une baisse de performance est signalée, nous enquêtons immédiatement
Cette amélioration de vitesse vient d’une réduction du temps de traitement par token, tandis que la qualité du modèle et les poids restent inchangés
Référence : Claude Code Tracker (MarginLab)
Ce qui est intéressant, c’est qu’ils ont maintenu le même prix alors que le coût d’inférence serait bien plus élevé chez Cerebras
Si c’était le cas, le comportement du modèle aurait changé et la vitesse aurait été environ 10 fois plus élevée
Ils ont probablement réécrit de nouveaux kernels optimisés pour la série Blackwell
La vitesse a toujours été mon plus gros reproche, donc cette amélioration me donne envie de réessayer
Je me demande comment ils ont obtenu une telle amélioration de vitesse
Il y a aussi beaucoup de messages sur Reddit disant que la qualité a baissé
C’est pareil sur les subreddits liés à Claude, et il y a très peu de preuves fiables