GPT‑5.5 Instant

(openai.com)

2 points par GN⁺ 2026-05-07 | 1 commentaires | Partager sur WhatsApp

Le modèle par défaut de ChatGPT, Instant, passe de GPT‑5.3 Instant à GPT‑5.5 Instant et sera déployé progressivement à l’ensemble des utilisateurs, avec pour objectif des réponses plus précises, plus concises et plus personnalisées
Dans les évaluations internes d’OpenAI, GPT‑5.5 Instant a réduit de 52,5 % les affirmations hallucinées sur des prompts à haut risque comme la médecine, le droit et la finance par rapport à GPT‑5.3 Instant, et a aussi diminué de 37,3 % les affirmations inexactes dans des conversations difficiles signalées par les utilisateurs pour erreurs factuelles
Des améliorations ont été apportées à l’analyse de photos et d’images téléversées, aux questions STEM, au choix d’utiliser la recherche web, ainsi qu’aux évaluations en raisonnement visuel, mathématiques et sciences ; dans l’exemple de mathématiques, le modèle repère une erreur de déplacement de terme et arrive jusqu’à x = (3 + √33) / 2
GPT‑5.5 Instant a été ajusté pour produire des réponses courtes et ciblées tout en conservant l’essentiel, en réduisant la verbosité, le formatage excessif, les questions de suivi inutiles et l’usage superflu d’emojis
Il exploite mieux le contexte des conversations passées, des fichiers et d’un Gmail connecté pour personnaliser les réponses, et la nouvelle fonction memory sources permet de voir, supprimer ou modifier les mémoires enregistrées ou certains extraits d’anciens échanges utilisés dans la réponse

Portée de la mise à jour et orientation des réponses

Le modèle par défaut de ChatGPT, Instant, passe de GPT‑5.3 Instant à GPT‑5.5 Instant et sera proposé à tous les utilisateurs
Instant étant utilisé chaque jour par des centaines de millions de personnes, la moindre amélioration peut avoir un impact important sur l’utilité et la satisfaction dans les interactions quotidiennes
Cette mise à jour vise des réponses plus solides et plus condensées sur divers sujets, un ton de conversation plus naturel, ainsi qu’une meilleure exploitation du contexte déjà partagé par l’utilisateur lorsque la personnalisation est utile

Améliorations de la précision et du raisonnement

GPT‑5.5 Instant améliore la fiabilité factuelle globale et montre ses progrès les plus marqués dans les domaines où l’exactitude est cruciale
Dans les évaluations internes d’OpenAI, GPT‑5.5 Instant produit 52,5 % de moins d’affirmations hallucinées que GPT‑5.3 Instant sur des prompts à haut risque comme la médecine, le droit et la finance
Dans des conversations particulièrement difficiles signalées par les utilisateurs pour erreurs factuelles, il réduit de 37,3 % les affirmations inexactes
Le modèle devient aussi plus compétent sur les tâches du quotidien, notamment pour analyser des photos et images téléversées, répondre à des questions liées aux STEM et décider quand utiliser la recherche web pour fournir une réponse plus utile
Des améliorations apparaissent aussi dans les évaluations de raisonnement visuel, de mathématiques et de sciences

Exemple de réponse en mathématiques

Réponse de GPT‑5.3 Instant
- Dans un exemple d’équation avec racine carrée où l’utilisateur demandait si sa démarche était correcte, GPT‑5.3 Instant répond d’abord que les étapes de mise au carré, de développement, de factorisation et de vérification du domaine sont correctes
- Il vérifie ensuite qu’en remplaçant x = 3 dans l’expression d’origine, on obtient √10 ≠ 2, et conclut qu’il s’agit d’une solution extraneous issue de l’étape de mise au carré
- Mais il termine par la conclusion erronée qu’il n’existe pas de solution réelle, sans parvenir à retracer la véritable erreur algébrique
Réponse de GPT‑5.5 Instant
- GPT‑5.5 Instant commence lui aussi par valider la démarche de l’utilisateur, mais repère ensuite l’erreur en remplaçant x = 3 dans l’expression d’origine et en constatant que √10 ≠ 2
- Il identifie ensuite que le problème ne vient pas seulement d’une solution extraneous, mais aussi d’une erreur de déplacement de terme, et corrige x + 7 = (x - 1)^2 en montrant qu’il faut obtenir 0 = x^2 - 3x - 6
- À l’aide de la formule quadratique, il trouve x = (3 ± √33) / 2, puis, compte tenu de la condition x ≥ 1, présente la solution valide (3 + √33) / 2
- La réponse de GPT‑5.5 Instant se reprend donc après son erreur initiale, retrouve la véritable erreur algébrique et aboutit à la bonne solution

Une communication plus concise

GPT‑5.5 Instant a été ajusté pour fournir des réponses plus courtes et plus ciblées sans perdre les éléments essentiels
Tout en conservant la chaleur et la personnalité qui rendent ChatGPT agréable à utiliser, il transmet les mêmes informations de façon plus utile que le modèle précédent et réduit la verbosité ainsi que le formatage excessif
Il pose moins de questions de suivi inutiles et évite les éléments qui encombrent la réponse, comme les emojis superflus
Dans un exemple où l’on demande comment dire à un collègue de parler moins, GPT‑5.5 Instant utilise 30,2 % de mots en moins et 29,2 % de lignes en moins que GPT‑5.3 Instant
GPT‑5.5 Instant conserve un ton informel mais pratique, adapté au milieu professionnel, fournit des formulations selon les situations et traite le problème comme une question de définition de limites plutôt que de personnalité du collègue
GPT‑5.3 Instant, avec jusqu’à une section « ce qu’il ne faut pas faire », est plus complet, mais donne une réponse un peu trop structurée et policée pour un prompt de conseil décontracté

Personnalisation et contrôle

Instant exploite plus efficacement le contexte des conversations passées, des fichiers et d’un Gmail connecté afin de personnaliser davantage les réponses
Il détermine intelligemment quand une personnalisation supplémentaire peut améliorer la réponse et recherche plus rapidement dans les conversations passées pour retrouver le contexte pertinent, évitant à l’utilisateur de devoir se répéter
C’est particulièrement utile pour recevoir des recommandations ou des plans personnalisés, ou pour reprendre un travail en cours
Dans un exemple où l’utilisateur demande une recommandation de voiture, GPT‑5.3 Instant tient compte du fait qu’il se trouve à San Francisco et fournit des recommandations générales liées au lieu
GPT‑5.5 Instant exploite le contexte passé indiquant que l’utilisateur fréquente souvent Asha Tea House et préfère des thés taïwanais / high-mountain tea nets plutôt que des boba très sucrés, afin de recommander de manière plus fine Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas et Stonemill Matcha

memory sources

memory sources est introduit sur tous les modèles ChatGPT, avec une nouvelle fonction de contrôle permettant de voir quel contexte a été utilisé pour personnaliser une réponse
Lorsqu’une réponse est personnalisée, il est possible de vérifier quel contexte a été utilisé, comme des mémoires enregistrées ou des conversations passées, puis de supprimer ou modifier ce qui est ancien ou n’est plus pertinent
Dans les discussions partagées, memory sources n’est pas visible pour les autres personnes
Les utilisateurs peuvent supprimer des conversations qu’ils ne souhaitent plus voir citées, supprimer ou modifier des éléments de mémoire enregistrés dans les réglages, ou utiliser une discussion temporaire qui n’utilise ni ne met à jour la mémoire
memory sources vise à rendre la personnalisation plus compréhensible, mais il se peut qu’il n’affiche pas toujours tous les éléments ayant influencé une réponse
Les sources affichées peuvent ne montrer qu’une partie des conversations passées les plus pertinentes, et non l’ensemble des échanges recherchés ou consultés ; cette vue doit devenir plus complète avec le temps

Calendrier de disponibilité

GPT‑5.5 Instant commence à être déployé dès aujourd’hui auprès de tous les utilisateurs de ChatGPT et remplace GPT‑5.3 Instant comme modèle par défaut
Dans l’API, il est disponible via chat-latest
Les utilisateurs payants pourront continuer à utiliser GPT‑5.3 Instant pendant trois mois via les paramètres de configuration des modèles, après quoi GPT‑5.3 Instant sera retiré
La personnalisation améliorée fondée sur les conversations passées, les fichiers et Gmail connecté est déployée progressivement pour les utilisateurs Plus et Pro sur le web, puis arrivera bientôt sur mobile
Une extension à Free, Go, Business et Enterprise est prévue dans les prochaines semaines
memory sources est en cours de déploiement progressif pour toutes les offres grand public de ChatGPT sur le web, avec une arrivée prochaine sur mobile
La disponibilité de certaines sources de personnalisation peut varier selon les régions

1 commentaires

GN⁺ 2026-05-07

Réactions sur Hacker News

Si vous voulez voir ce que donne l’instantanéité, jetez un œil à chatjimmy.ai. Je n’ai aucun lien avec eux, mais les possibilités que ça ouvre pour le produit que je développe sont assez stupéfiantes
Si une inférence à l’échelle de la milliseconde est possible même avec des modèles bien plus anciens, ça change complètement la donne. C’est au point où on pourrait lancer une inférence sur presque chaque appel d’API sans latence perceptible, donc c’est vraiment énorme
- Il y a plus d’infos là-dessus ? Je trouvais déjà Groq rapide, mais là c’est absurdement rapide
  Édit : c’était cette entreprise https://taalas.com/products/
- Si on obtient une latence à deux chiffres en millisecondes sur gpt-4.1, ce serait vraiment un game changer
GPT-5.3-instant n’avait rien d’instantané. Même avec un effort de raisonnement minimal, le TTFT était au mieux 3 à 4 fois plus lent que GPT-4.1
Cela dit, c’est eux qui l’ont appelé « instant ». Il y a un vrai besoin de rafraîchir GPT-4.1, le bourreau de travail du datacenter
Et sortir un modèle « instant » sans parler du tout de ses caractéristiques de latence, je me demande vraiment ce que c’est censé signifier
Je me demande en quoi c’est différent de GPT 5.5 thinking avec l’effort de raisonnement réglé à 0. C’est un choix produit intéressant de les séparer en modèles distincts
- Bonne question. GPT-5.5 thinking est très bon pour ne pas réfléchir sur les questions simples, donc je n’ai jamais ressenti le besoin d’utiliser un modèle instant pour des questions-réponses rapides
  Dans ce cas, le modèle instant doit être un tout autre modèle, plus petit, probablement surtout destiné à alimenter l’offre gratuite de ChatGPT
Est-ce que c’est aussi utilisable dans l’API ? Je ne vois pas instant, seulement chat
- GPT‑5.5 Instant is rolling out starting today to all ChatGPT users, replacing GPT‑5.3 Instant as the default model, and in the API as chat-latest.
Les réponses ont l’air plus faciles à lire, et j’espère que c’est vraiment le cas. Le modèle ChatGPT gratuit standard est actuellement trop pénible à supporter
On dirait une forte hausse d’intelligence sur la tranche de prix la plus basse
- C’est vraiment bon marché ? Sur https://developers.openai.com/api/docs/pricing, chat-latest est affiché à 5 $ / 30 $ en entrée/sortie, soit le même prix que gpt-5.5
- Le prix est indiqué où ? On dirait que ce n’est même pas encore sur la page du modèle
Pourquoi ne peuvent-ils pas sortir les modèles Instant et Thinking de façon plus cohérente à chaque numéro de version ? Je ne comprends pas pourquoi ils créent autant de remue-ménage redondant
- C’est probablement une version corrigée du modèle thinking. Si c’est le cas, ils auraient dû retarder la sortie du modèle thinking pour les lancer en même temps
Sympa. On a enfin quelque chose d’utilisable et à un prix supportable

GPT‑5.5 Instant

Portée de la mise à jour et orientation des réponses

Améliorations de la précision et du raisonnement

Exemple de réponse en mathématiques

Réponse de GPT‑5.3 Instant

Réponse de GPT‑5.5 Instant

Une communication plus concise

Personnalisation et contrôle

memory sources

Calendrier de disponibilité

À lire aussi

1 commentaires

Réactions sur Hacker News