GPT‑5.5 Instant
(openai.com)- Le modèle par défaut de ChatGPT, Instant, passe de GPT‑5.3 Instant à GPT‑5.5 Instant et sera déployé progressivement à l’ensemble des utilisateurs, avec pour objectif des réponses plus précises, plus concises et plus personnalisées
- Dans les évaluations internes d’OpenAI, GPT‑5.5 Instant a réduit de 52,5 % les affirmations hallucinées sur des prompts à haut risque comme la médecine, le droit et la finance par rapport à GPT‑5.3 Instant, et a aussi diminué de 37,3 % les affirmations inexactes dans des conversations difficiles signalées par les utilisateurs pour erreurs factuelles
- Des améliorations ont été apportées à l’analyse de photos et d’images téléversées, aux questions STEM, au choix d’utiliser la recherche web, ainsi qu’aux évaluations en raisonnement visuel, mathématiques et sciences ; dans l’exemple de mathématiques, le modèle repère une erreur de déplacement de terme et arrive jusqu’à
x = (3 + √33) / 2 - GPT‑5.5 Instant a été ajusté pour produire des réponses courtes et ciblées tout en conservant l’essentiel, en réduisant la verbosité, le formatage excessif, les questions de suivi inutiles et l’usage superflu d’emojis
- Il exploite mieux le contexte des conversations passées, des fichiers et d’un Gmail connecté pour personnaliser les réponses, et la nouvelle fonction memory sources permet de voir, supprimer ou modifier les mémoires enregistrées ou certains extraits d’anciens échanges utilisés dans la réponse
Portée de la mise à jour et orientation des réponses
- Le modèle par défaut de ChatGPT, Instant, passe de GPT‑5.3 Instant à GPT‑5.5 Instant et sera proposé à tous les utilisateurs
- Instant étant utilisé chaque jour par des centaines de millions de personnes, la moindre amélioration peut avoir un impact important sur l’utilité et la satisfaction dans les interactions quotidiennes
- Cette mise à jour vise des réponses plus solides et plus condensées sur divers sujets, un ton de conversation plus naturel, ainsi qu’une meilleure exploitation du contexte déjà partagé par l’utilisateur lorsque la personnalisation est utile
Améliorations de la précision et du raisonnement
- GPT‑5.5 Instant améliore la fiabilité factuelle globale et montre ses progrès les plus marqués dans les domaines où l’exactitude est cruciale
- Dans les évaluations internes d’OpenAI, GPT‑5.5 Instant produit 52,5 % de moins d’affirmations hallucinées que GPT‑5.3 Instant sur des prompts à haut risque comme la médecine, le droit et la finance
- Dans des conversations particulièrement difficiles signalées par les utilisateurs pour erreurs factuelles, il réduit de 37,3 % les affirmations inexactes
- Le modèle devient aussi plus compétent sur les tâches du quotidien, notamment pour analyser des photos et images téléversées, répondre à des questions liées aux STEM et décider quand utiliser la recherche web pour fournir une réponse plus utile
- Des améliorations apparaissent aussi dans les évaluations de raisonnement visuel, de mathématiques et de sciences
Exemple de réponse en mathématiques
-
Réponse de GPT‑5.3 Instant
- Dans un exemple d’équation avec racine carrée où l’utilisateur demandait si sa démarche était correcte, GPT‑5.3 Instant répond d’abord que les étapes de mise au carré, de développement, de factorisation et de vérification du domaine sont correctes
- Il vérifie ensuite qu’en remplaçant
x = 3dans l’expression d’origine, on obtient√10 ≠ 2, et conclut qu’il s’agit d’une solution extraneous issue de l’étape de mise au carré - Mais il termine par la conclusion erronée qu’il n’existe pas de solution réelle, sans parvenir à retracer la véritable erreur algébrique
-
Réponse de GPT‑5.5 Instant
- GPT‑5.5 Instant commence lui aussi par valider la démarche de l’utilisateur, mais repère ensuite l’erreur en remplaçant
x = 3dans l’expression d’origine et en constatant que√10 ≠ 2 - Il identifie ensuite que le problème ne vient pas seulement d’une solution extraneous, mais aussi d’une erreur de déplacement de terme, et corrige
x + 7 = (x - 1)^2en montrant qu’il faut obtenir0 = x^2 - 3x - 6 - À l’aide de la formule quadratique, il trouve
x = (3 ± √33) / 2, puis, compte tenu de la conditionx ≥ 1, présente la solution valide(3 + √33) / 2 - La réponse de GPT‑5.5 Instant se reprend donc après son erreur initiale, retrouve la véritable erreur algébrique et aboutit à la bonne solution
- GPT‑5.5 Instant commence lui aussi par valider la démarche de l’utilisateur, mais repère ensuite l’erreur en remplaçant
Une communication plus concise
- GPT‑5.5 Instant a été ajusté pour fournir des réponses plus courtes et plus ciblées sans perdre les éléments essentiels
- Tout en conservant la chaleur et la personnalité qui rendent ChatGPT agréable à utiliser, il transmet les mêmes informations de façon plus utile que le modèle précédent et réduit la verbosité ainsi que le formatage excessif
- Il pose moins de questions de suivi inutiles et évite les éléments qui encombrent la réponse, comme les emojis superflus
- Dans un exemple où l’on demande comment dire à un collègue de parler moins, GPT‑5.5 Instant utilise 30,2 % de mots en moins et 29,2 % de lignes en moins que GPT‑5.3 Instant
- GPT‑5.5 Instant conserve un ton informel mais pratique, adapté au milieu professionnel, fournit des formulations selon les situations et traite le problème comme une question de définition de limites plutôt que de personnalité du collègue
- GPT‑5.3 Instant, avec jusqu’à une section « ce qu’il ne faut pas faire », est plus complet, mais donne une réponse un peu trop structurée et policée pour un prompt de conseil décontracté
Personnalisation et contrôle
- Instant exploite plus efficacement le contexte des conversations passées, des fichiers et d’un Gmail connecté afin de personnaliser davantage les réponses
- Il détermine intelligemment quand une personnalisation supplémentaire peut améliorer la réponse et recherche plus rapidement dans les conversations passées pour retrouver le contexte pertinent, évitant à l’utilisateur de devoir se répéter
- C’est particulièrement utile pour recevoir des recommandations ou des plans personnalisés, ou pour reprendre un travail en cours
- Dans un exemple où l’utilisateur demande une recommandation de voiture, GPT‑5.3 Instant tient compte du fait qu’il se trouve à San Francisco et fournit des recommandations générales liées au lieu
- GPT‑5.5 Instant exploite le contexte passé indiquant que l’utilisateur fréquente souvent Asha Tea House et préfère des thés taïwanais / high-mountain tea nets plutôt que des boba très sucrés, afin de recommander de manière plus fine Ceré Tea, Song Tea & Ceramics, Tea Rex Cafe & Specialty Teas et Stonemill Matcha
memory sources
- memory sources est introduit sur tous les modèles ChatGPT, avec une nouvelle fonction de contrôle permettant de voir quel contexte a été utilisé pour personnaliser une réponse
- Lorsqu’une réponse est personnalisée, il est possible de vérifier quel contexte a été utilisé, comme des mémoires enregistrées ou des conversations passées, puis de supprimer ou modifier ce qui est ancien ou n’est plus pertinent
- Dans les discussions partagées, memory sources n’est pas visible pour les autres personnes
- Les utilisateurs peuvent supprimer des conversations qu’ils ne souhaitent plus voir citées, supprimer ou modifier des éléments de mémoire enregistrés dans les réglages, ou utiliser une discussion temporaire qui n’utilise ni ne met à jour la mémoire
- memory sources vise à rendre la personnalisation plus compréhensible, mais il se peut qu’il n’affiche pas toujours tous les éléments ayant influencé une réponse
- Les sources affichées peuvent ne montrer qu’une partie des conversations passées les plus pertinentes, et non l’ensemble des échanges recherchés ou consultés ; cette vue doit devenir plus complète avec le temps
Calendrier de disponibilité
- GPT‑5.5 Instant commence à être déployé dès aujourd’hui auprès de tous les utilisateurs de ChatGPT et remplace GPT‑5.3 Instant comme modèle par défaut
- Dans l’API, il est disponible via
chat-latest - Les utilisateurs payants pourront continuer à utiliser GPT‑5.3 Instant pendant trois mois via les paramètres de configuration des modèles, après quoi GPT‑5.3 Instant sera retiré
- La personnalisation améliorée fondée sur les conversations passées, les fichiers et Gmail connecté est déployée progressivement pour les utilisateurs Plus et Pro sur le web, puis arrivera bientôt sur mobile
- Une extension à Free, Go, Business et Enterprise est prévue dans les prochaines semaines
- memory sources est en cours de déploiement progressif pour toutes les offres grand public de ChatGPT sur le web, avec une arrivée prochaine sur mobile
- La disponibilité de certaines sources de personnalisation peut varier selon les régions
1 commentaires
Réactions sur Hacker News
Si vous voulez voir ce que donne l’instantanéité, jetez un œil à chatjimmy.ai. Je n’ai aucun lien avec eux, mais les possibilités que ça ouvre pour le produit que je développe sont assez stupéfiantes
Si une inférence à l’échelle de la milliseconde est possible même avec des modèles bien plus anciens, ça change complètement la donne. C’est au point où on pourrait lancer une inférence sur presque chaque appel d’API sans latence perceptible, donc c’est vraiment énorme
Édit : c’était cette entreprise https://taalas.com/products/
GPT-5.3-instant n’avait rien d’instantané. Même avec un effort de raisonnement minimal, le TTFT était au mieux 3 à 4 fois plus lent que GPT-4.1
Cela dit, c’est eux qui l’ont appelé « instant ». Il y a un vrai besoin de rafraîchir GPT-4.1, le bourreau de travail du datacenter
Et sortir un modèle « instant » sans parler du tout de ses caractéristiques de latence, je me demande vraiment ce que c’est censé signifier
Je me demande en quoi c’est différent de GPT 5.5 thinking avec l’effort de raisonnement réglé à 0. C’est un choix produit intéressant de les séparer en modèles distincts
Dans ce cas, le modèle instant doit être un tout autre modèle, plus petit, probablement surtout destiné à alimenter l’offre gratuite de ChatGPT
Est-ce que c’est aussi utilisable dans l’API ? Je ne vois pas instant, seulement chat
Les réponses ont l’air plus faciles à lire, et j’espère que c’est vraiment le cas. Le modèle ChatGPT gratuit standard est actuellement trop pénible à supporter
On dirait une forte hausse d’intelligence sur la tranche de prix la plus basse
chat-latestest affiché à 5 $ / 30 $ en entrée/sortie, soit le même prix que gpt-5.5Pourquoi ne peuvent-ils pas sortir les modèles Instant et Thinking de façon plus cohérente à chaque numéro de version ? Je ne comprends pas pourquoi ils créent autant de remue-ménage redondant
Sympa. On a enfin quelque chose d’utilisable et à un prix supportable