4 points par GN⁺ 2026-02-05 | 1 commentaires | Partager sur WhatsApp
  • La vitesse de traitement des modèles GPT-5.2 et GPT-5.2-Codex a été améliorée de 40 % par rapport à auparavant
  • Optimisation de la pile d’inférence pour tous les utilisateurs de l’API
  • Il s’agit du même modèle et des mêmes poids, mais avec une latence réduite

1 commentaires

 
GN⁺ 2026-02-05
Avis sur Hacker News
  • Au cours du dernier mois, OpenAI a lancé plusieurs fonctionnalités pour les utilisateurs de Codex

    • prise en charge des subagents
    • interface multi-agent améliorée (application Codex)
    • vitesse d’inférence 40 % plus rapide
      Rien qu’avec les deux premières fonctionnalités, j’ai l’impression que ma productivité a triplé. J’attends vraiment cette mise à jour avec impatience
    • Je me demande comment fonctionnent les subagents
    • C’est une fonctionnalité réservée à l’API
    • Quand on utilise Claude, les performances s’améliorent au carré. OpenAI doit sans doute se sentir sous pression
  • Pendant le week-end, j’ai exécuté le même prompt sur GPT-5.2, Gemini 3 et Grok
    Gemini 3 et Grok ont terminé en moins de 2 minutes en « thinking mode », tandis que GPT-5.2 faisait du sur-place pendant 6 minutes

  • Récemment, roon aurait remarqué que les comptes employés étaient bien plus rapides que ceux des utilisateurs ordinaires
    Il aurait alors compris qu’ils pouvaient exécuter les appels à l’API interne de façon plus efficace que pour les utilisateurs classiques
    Au final, les utilisateurs ordinaires semblent n’être traités que sur la capacité restante
    Article lié : Choose Your Fighter (The Zvi)

  • À mon avis, OpenAI a l’habitude de dégrader volontairement la qualité après la sortie d’un modèle
    La version web de ChatGPT 5.2 était bien meilleure au début, puis la qualité a soudainement chuté après 1 à 2 semaines
    Ça ressemblait à une stratégie pour tromper la presse et les benchmarks
    Pour accélérer, il suffit simplement de réduire l’intensité du raisonnement, donc j’ai du mal à croire à cette amélioration de 40 %
    Ça pourrait aussi être une « entourloupe » du genre donner d’abord le modèle Pro aux utilisateurs ChatGPT Plus, puis le remplacer plus tard par la version Standard

    • Je comprends ce point de vue sceptique, mais nous ne faisons pas ce genre de tromperie
      Nous maintenons une qualité de modèle constante, et si une baisse de performance est signalée, nous enquêtons immédiatement
      Cette amélioration de vitesse vient d’une réduction du temps de traitement par token, tandis que la qualité du modèle et les poids restent inchangés
    • OpenAI n’est pas la seule. Anthropic a aussi des cas similaires
      Référence : Claude Code Tracker (MarginLab)
    • Ce serait bien de créer un site de benchmarks quotidiens pour Codex
    • Il suffit de relancer soi-même les benchmarks
  • Ce qui est intéressant, c’est qu’ils ont maintenu le même prix alors que le coût d’inférence serait bien plus élevé chez Cerebras

    • Mais il est peu probable que ce soit Cerebras.
      Si c’était le cas, le comportement du modèle aurait changé et la vitesse aurait été environ 10 fois plus élevée
      Ils ont probablement réécrit de nouveaux kernels optimisés pour la série Blackwell
    • Il est presque certain que ce n’est pas exécuté sur Cerebras
  • La vitesse a toujours été mon plus gros reproche, donc cette amélioration me donne envie de réessayer

  • Je me demande comment ils ont obtenu une telle amélioration de vitesse

  • Il y a aussi beaucoup de messages sur Reddit disant que la qualité a baissé

    • Mais sur Reddit, ce genre de message apparaît tous les jours.
      C’est pareil sur les subreddits liés à Claude, et il y a très peu de preuves fiables