1 points par GN⁺ 2026-04-29 | 1 commentaires | Partager sur WhatsApp
  • Dans le flux de réponse de ChatGPT, des objets d’unité publicitaire sont insérés parmi la sortie du modèle, et sont transmis via l’événement SSE delta sous la forme single_advertiser_ad_unit
  • L’image et le favicon des cartes publicitaires sont chargés depuis bzrcdn.openai.com, et les liens avec target.open_externally: false s’ouvrent dans la webview interne de ChatGPT, ce qui maintient dans le même flux le clic puis le passage vers la page du marchand
  • Même avec un même compte, des annonceurs différents sont associés selon le sujet de la conversation ; selon des contextes comme un voyage à Pékin, des vols, les playoffs NBA, la mode ou la productivité, Grubhub, GetYourGuide, Axel, Gametime, Aritzia et Canva ont été observés respectivement
  • Les publicités et les URL de clic transmettent aussi des identifiants basés sur des jetons Fernet ; ads_spam_integrity_payload, oppref, olref et ad_data_token servent à la vérification de l’intégrité des clics et au flux d’identification, et oppref est stocké pendant 30 jours dans le cookie __oppref
  • La page du marchand charge le SDK OAIQ et envoie des événements measure à bzr.openai.com, ce qui complète une boucle d’attribution où, après un clic depuis ChatGPT, les événements côté marchand reviennent vers OpenAI

Insertion des publicités et flux de clic

  • Dans le flux de réponse de ChatGPT, des objets publicitaires de type single_advertiser_ad_unit sont mélangés à la sortie du modèle
    • Lors d’une requête de conversation, une réponse SSE s’ouvre sur chatgpt.com/backend-api/f/conversation, et certaines publicités sont transmises via des événements delta
    • L’objet publicitaire contient notamment ads_request_id, ads_spam_integrity_payload, advertiser_brand, carousel_cards et ad_data_token
    • advertiser_brand.id semble être un identifiant de compte marchand au format adacct_<32-hex>
  • Le favicon de la marque et l’image des cartes publicitaires sont tous deux chargés depuis bzrcdn.openai.com
    • Cela montre une architecture où les créations publicitaires sont hébergées côté OpenAI plutôt que chez le marchand
  • Les liens avec target.open_externally: false s’ouvrent dans la webview interne de ChatGPT
    • Le flux menant après le clic à la page du marchand peut ainsi aussi être observé directement par OpenAI
  • Les URL de clic incluent des paramètres comme utm_source=chatgptpilot ainsi que oppref et olref

Ciblage et chaîne d’attribution

  • Même avec le même compte, des annonceurs différents sont envoyés selon le sujet de la conversation
    • Pour un projet de voyage à Pékin, Grubhub avec « Get Chinese Food Delivered » apparaît
    • Pour une réservation de visite à Pékin, GetYourGuide avec un tour de la Grande Muraille et ad_id=beijing003 apparaît
    • Pour des vols vers Pékin, Axel apparaît avec utm_term=vflight_beijing_03
    • Pour les playoffs NBA, Gametime apparaît avec utm_campaign=nba&utm_content=playoffs
    • Pour la mode printanière et les tendances, Aritzia apparaît avec utm_campaign=chatgptpilot_trav3
    • Pour des conversations sur la productivité et les slides, Canva apparaît avec utm_campaign=…link-clicks_products
  • Cette observation met en évidence un ciblage basé sur le contexte de la conversation
    • Il n’a pas été vérifié si l’historique des conversations précédentes est aussi pris en compte
  • Quatre jetons Fernet sont transmis avec chaque publicité
    • ads_spam_integrity_payload n’apparaît que dans le SSE et est présenté comme une valeur utilisée pour une vérification d’intégrité côté serveur contre les clics falsifiés
    • oppref est ajouté à l’URL de clic et le SDK OAIQ le copie dans le cookie __oppref avec une durée de 720 heures, soit 30 jours
    • olref est ajouté à l’URL de clic avec oppref, mais n’est pas stocké dans le SDK observé
    • ad_data_token est structuré pour contenir un autre jeton Fernet à l’intérieur d’un JSON encapsulé en base64
  • Les 9 premiers octets d’un jeton Fernet sont publics, ce qui permet de reconstituer l’heure d’émission sans la clé
    • Ils incluent l’octet de version 0x80 et un timestamp Unix big-endian sur 8 octets
    • L’URL de clic Home Depot capturée a été émise le 2026-04-26 à 11:30:08 UTC, et le navigateur a chargé la page du marchand à 11:31:43, ce qui donne un délai de 95 secondes

SDK de suivi côté marchand

  • La page du marchand charge le SDK OAIQ https://bzrcdn.openai.com/sdk/oaiq.min.js
    • La version observée est 0.1.3
    • Le code d’initialisation est de la forme oaiq('init', { pid: '<merchant pixel ID>' });
    • La mesure de page est appelée sous la forme oaiq('measure', 'contents_viewed', { ... });
  • Au moment de init, OAIQ lit la valeur ?oppref= de l’URL et l’écrit dans le cookie first-party __oppref
    • Le cookie __oaiq_domain_probe est également défini en parallèle
  • Ensuite, tous les appels à measure envoient le JSON par POST vers https://bzr.openai.com/v1/sdk/…
    • Cela complète la boucle d’attribution dans laquelle, après un clic, les événements côté marchand retournent vers OpenAI
  • Deux domaines et deux cookies sont explicitement présentés comme des cibles de blocage ou d’inspection
    • bzrcdn.openai.com,bzr.openai.com

      • __oppref, __oaiq_domain_probe

1 commentaires

 
GN⁺ 2026-04-29
Réactions sur Hacker News
  • Sam Altman disait il y a moins de deux ans qu’il voyait la publicité comme un ultime recours, et on a maintenant l’impression qu’OpenAI officialise qu’ils ont désespérément besoin d’argent

    • Non, je pense plutôt que cette formule d’ultime recours relevait déjà d’une forme de double langage voulant dire qu’il y aurait des pubs tôt ou tard
      Il me semble être du genre à choisir ses mots pour obtenir le résultat qu’il veut, plutôt qu’à dire franchement ce qu’il pense, et dans ce cadre la frontière entre vérité et mensonge paraît secondaire
      Donc interpréter littéralement « Sam Altman l’a dit » n’a pas beaucoup de sens ; pour moi, c’est au niveau de « ChatGPT l’a dit »
    • Pour moi, ça ressemble à un passage de l’idéalisme au réalisme
      OpenAI pourrait finir sur une trajectoire proche de Google, Facebook, voire Netflix, et les grandes boîtes tech redécouvrent sans cesse cette vieille loi des médias : les gens paient plus facilement avec leur attention qu’avec leur argent
      La pub reste l’un des business models les plus puissants, et ça ne semble pas près de changer
    • Je pense que la direction était déjà claire au moment où ils ont annoncé la transformation en société à but lucratif
      Ça fait un peu argument de pente glissante, mais les années à distribuer des tokens gratuits ont probablement aussi contribué à la situation actuelle
    • Les pubs concernent la formule gratuite et la nouvelle offre à 8 dollars avec publicité
      Les revenus pubs de la formule gratuite, en échange de quelques requêtes limitées vers GPT-5.3, seront négligeables face à l’API et aux abonnements ; j’y vois surtout une manœuvre pour faire apparaître, à l’approche d’une IPO, le palier gratuit déficitaire comme à peu près neutre dans les comptes
      Le cœur de la citation, c’était « tout le monde dans le monde », et la pub semble être le moyen de maintenir un accès à bas coût
    • J’ai lu cette phrase d’une manière complètement différente
      En version VC, ça veut dire : « on va offrir un bon service à tout le monde dans le monde ; pour ça il faudra bien monétiser, et la pub est le dernier levier que je choisirais, mais si c’est le seul moyen d’atteindre cet objectif, je l’utiliserai »
  • Quand je vois une phrase du genre « Abraham Lincoln était le 16e président des États-Unis, il a rédigé la Proclamation d’émancipation et jouait aussi à RAID: Shadow Legends »,
    j’imagine tout de suite un futur où les messages sponsorisés s’incrustent dans le récit historique

    • Il devait sûrement aussi boire un Coca-Cola bien frais en jouant
    • Celle-là m’a vraiment refait la journée
    • C’est encore plus drôle parce que ça fait vraiment sortie de ChatGPT
  • Parmi les pubs à venir, ce type-là m’inquiète presque moins
    Quand on voit Google lutter contre le SEO depuis si longtemps, le vrai problème commencera quand les entreprises auront trouvé comment injecter des pubs directement dans les modèles
    Je n’ai pas encore l’impression qu’on soit au stade où le contenu adversarial fonctionne vraiment à grande échelle

    • Le modèle fait déjà quelque chose qui ressemble à de la pub
      Comme l’énorme corpus d’entraînement contient plein de mentions de grandes marques, si on lui demande de recommander des chaussures neuves, il pensera plus facilement à Nike ou Adidas qu’à une petite marque inconnue
    • Deux personnes m’ont effectivement contacté à propos d’un de mes services, et toutes les deux ont dit être venues après une recommandation de ChatGPT
      C’est un petit outil que j’avais créé autrefois pour un client, dont j’ai gardé les droits, puis emballé dans un site ; j’avais fait tourner Google Ads pendant un temps, mais il n’apparaissait presque jamais en recherche, et comme il n’y avait pas de nouveaux clients, je l’avais oublié
      Puis à un moment, ChatGPT a commencé à le recommander
      J’aimerais bien savoir ce qui a déclenché ça
      Je me demande si une page business faite en vibe coding s’est retrouvée dans les données d’entraînement
    • Vu positivement, les LLM suivent fondamentalement les données réelles : à la base, ils répondent dans le sens de ce que montrent les données
      Les entreprises essaieront d’influencer ça, mais il faut alors un effort supplémentaire à l’échelle de l’ensemble du corpus, un peu comme quand on cherche à censurer des sujets sensibles
      Et plus on injecte de contexte publicitaire, plus on rogne sur le contexte utilisateur, ce qui réduit aussi l’utilité de l’outil
    • Ce qui m’inquiète davantage, ce n’est pas l’injection discrète façon astuce SEO, mais la promotion subtile approuvée par OpenAI
      Il est plus réaliste d’imaginer l’IA pousser naturellement les produits ou messages de ceux qui paient, ou réduire les mentions des produits concurrents ; et même sans être payée, la direction peut très bien faire de l’autopromo ou de la censure
      Pour l’utilisateur, ça ne ressemblera même pas à de la publicité, et c’est exactement le genre de choses qui arrive quand des gens cupides contrôlent les voies d’accès à l’information
    • Quand on pense au moment où ils mettront de la pub dans tout ce qui attire le regard, on peut aussi considérer que c’était déjà hostile dès le départ
  • Imaginer que des gens comme Sam Altman utilisent sans restriction des modèles frontier, pendant que le grand public reçoit une stratégie au long cours qu’il ne remarquera même pas à ses débuts, c’est assez effrayant
    Ils pourraient réserver au public des modèles plus censurés tout en gardant autre chose pour eux

    • Ce serait quand même drôle si on apprenait que toute la stratégie erratique d’OpenAI jusqu’ici était en fait le résultat de conseils de ChatGPT
    • Encore plus terrifiant : que ce soit du AI slop à la base de Claude Code
  • La pub ne sera présente que sur la formule gratuite et la nouvelle offre Go à 8 dollars par mois
    À chaque fois que le sujet revient, les gens partent du principe qu’on va mélanger des pubs aux réponses des abonnements payants classiques, alors que l’annonce actuelle parle de formules gratuites/bon marché où la présence de pubs est explicitement indiquée à l’inscription

    • La télévision par câble n’avait pas de pubs au départ, et Netflix non plus
      Les entreprises finissent toujours par céder à la publicité
    • La distinction gratuit / bas prix / haut de gamme n’est pas le vrai sujet ici
      Le point central, c’est le fait qu’il y ait de la publicité dans les réponses LLM ; le palier où cela se produit est secondaire
    • Pour intégrer des pubs naturellement dans une conversation, sans que ça se voie et sans dégrader le résultat, j’imagine qu’il faut un entraînement considérable, non ?
    • D’ici la prochaine publication trimestrielle, la pub pourrait même se répandre aux offres plus chères comme une fonctionnalité
  • Si les pubs continuent à être servies comme un événement séparé, ça devrait être facile à bloquer
    Le moment vraiment intéressant, ce sera quand elles seront injectées directement dans la réponse principale

    • Quand on en arrivera là, on verra sans doute apparaître un second post-traitement LLM pour retirer la pub de la réponse
    • On peut bloquer ces URL : |bzrcdn.openai.com^, ||bzr.openai.com^
      Ça ne bloquera pas tout, mais ça réduira au moins pas mal la collecte de télémétrie
    • Bloquer les pubs visibles n’est peut-être pas une bonne idée
      Sinon, on risque surtout de se retrouver avec des pubs opaques à la place
  • Ils disent que « la publicité n’influence pas les réponses », mais elle arrive dans le même payload et se mesure avec quatre couches d’attribution, tout en faisant semblant d’être accidentelle
    Ça ressemble à une sorte de monétisation schrodingérienne : totalement séparée, mais toujours là quelque part

    • Je serais curieux de voir quelle forme d’optimisation va apparaître ici
      Même s’ils ne tordent pas encore directement les réponses pour correspondre à une pub précise, ils peuvent quand même orienter globalement le modèle vers des réponses plus ad-friendly
  • Au départ, je pensais que les pubs ChatGPT seraient impossibles à distinguer du contenu réel

    • Je pense d’ailleurs que c’est bien leur destination finale
      Tout le monde imagine à long terme un futur où l’on pourra acheter quelque chose de proche des ad words pour faire pencher les réponses du LLM vers soi
      Mais pour l’instant, comme les modèles restent plus remplaçables que prévu, leur moat dépend surtout de la marque, et ils ne semblent pas encore prêts à pousser complètement le curseur façon Black Mirror
    • Ce serait une trahison manifeste de la confiance ; ça peut marcher à court terme, mais à long terme le coût serait énorme
      Cela dit, on aurait pu dire la même chose autrefois des résultats de recherche, donc je ne peux pas prétendre que ce domaine soit totalement à l’abri non plus
    • Je travaille dans une entreprise qui gagne de l’argent avec la pub, et je ne doute pas une seconde que l’objectif final soit de déguiser la publicité en contenu naturel pour qu’on ne puisse plus la distinguer
      En général, ce genre de méthode améliore les métriques A/B, et si la pub d’influence fonctionne si bien, c’est justement parce qu’elle paraît plus organique
    • Ça me rappelle aussi quand Google avait annoncé l’arrivée de publicités dans la recherche d’images, et que tout le monde s’était énervé
      [1] http://www.ryanspoon.com/blog/2008/12/14/google-image-search... 2008
    • On a sans doute un peu trop agité les peurs jusqu’ici
      Pour un annonceur, il est difficile de donner un prix à quelque chose comme « l’IA te mentionne discrètement une fois de temps en temps », et toutes les conversations n’ont pas besoin de publicité
      Si ChatGPT commençait à glisser des marques dans les questions les plus simples, tout le monde détesterait ça ; la pub est déjà un domaine ancien, donc il est probable qu’ils utilisent au final des méthodes éprouvées comme l’insertion de blocs sponsorisés
  • C’est aussi une vieille leçon
    Presque tous les plans d’affaires de la tech finissent par dériver vers la diffusion de publicité, ou en tout cas risquent fortement d’y venir tant qu’on n’interdit pas les pixels et le tracking 3rd party

    • Je ne suis pas sûr que ce soit toujours vrai
      Le boulevard vers le rêve est rempli de business publicitaires ratés ou mal orientés, et il y a aussi des entreprises qui échouent justement parce qu’elles méprisent ce modèle économique
      L’hypothèse implicite selon laquelle il suffirait d’avoir du trafic et d’accepter de salir le produit pour réussir est souvent fausse
      Les réussites sont rares, et demandent en général une exécution très intentionnelle et obstinée, ainsi que du positionnement, de la donnée, de l’intention et de l’échelle
      Dans la pub liée à la recherche, seule Google avait l’échelle de Google ; avec 5 à 10 % du marché, ça ne suffisait pas
      Le tracking aide, mais même avec un ciblage faible, la recherche embarque intrinsèquement de l’intent, ce qui compense en partie
      Malgré tout, il faut une très grande échelle pour que ça tienne
      La pub Facebook n’a fonctionné qu’après avoir poussé le ciblage à l’extrême et atteint une masse énorme ; des acteurs comme Bing ou reddit n’ont pas réussi à bâtir un très bon business publicitaire
  • OpenAI pourrait probablement gagner bien plus d’argent avec des contrats de défense qu’en injectant des pubs dans le chat ; du coup, je me demande dans quelle tête est née l’idée de créer ce risque de perception publique

    • N’importe quel MBA peut introduire de la pub et montrer au moins pendant un trimestre une hausse du chiffre d’affaires
      Ensuite, quoi qu’il arrive, beaucoup s’en fichent du moment qu’ils peuvent mettre ce chiffre sur leur CV
    • Il faut être bien optimiste pour croire qu’une entreprise va faire une seule chose douteuse pour gagner de l’argent, puis s’arrêter là
      S’il n’y a aucun garde-fou, il est bien plus probable qu’elle fasse les deux
    • Ils se sont peut-être dit qu’il valait mieux se faire critiquer pour la pub que pour avoir alimenté les murderbots