Comment ChatGPT diffuse des publicités
(buchodi.com)- Dans le flux de réponse de ChatGPT, des objets d’unité publicitaire sont insérés parmi la sortie du modèle, et sont transmis via l’événement SSE
deltasous la formesingle_advertiser_ad_unit - L’image et le favicon des cartes publicitaires sont chargés depuis
bzrcdn.openai.com, et les liens avectarget.open_externally: falses’ouvrent dans la webview interne de ChatGPT, ce qui maintient dans le même flux le clic puis le passage vers la page du marchand - Même avec un même compte, des annonceurs différents sont associés selon le sujet de la conversation ; selon des contextes comme un voyage à Pékin, des vols, les playoffs NBA, la mode ou la productivité, Grubhub, GetYourGuide, Axel, Gametime, Aritzia et Canva ont été observés respectivement
- Les publicités et les URL de clic transmettent aussi des identifiants basés sur des jetons Fernet ;
ads_spam_integrity_payload,oppref,olrefetad_data_tokenservent à la vérification de l’intégrité des clics et au flux d’identification, etopprefest stocké pendant 30 jours dans le cookie__oppref - La page du marchand charge le SDK OAIQ et envoie des événements
measureàbzr.openai.com, ce qui complète une boucle d’attribution où, après un clic depuis ChatGPT, les événements côté marchand reviennent vers OpenAI
Insertion des publicités et flux de clic
- Dans le flux de réponse de ChatGPT, des objets publicitaires de type
single_advertiser_ad_unitsont mélangés à la sortie du modèle- Lors d’une requête de conversation, une réponse SSE s’ouvre sur
chatgpt.com/backend-api/f/conversation, et certaines publicités sont transmises via des événementsdelta - L’objet publicitaire contient notamment
ads_request_id,ads_spam_integrity_payload,advertiser_brand,carousel_cardsetad_data_token advertiser_brand.idsemble être un identifiant de compte marchand au formatadacct_<32-hex>
- Lors d’une requête de conversation, une réponse SSE s’ouvre sur
- Le favicon de la marque et l’image des cartes publicitaires sont tous deux chargés depuis
bzrcdn.openai.com- Cela montre une architecture où les créations publicitaires sont hébergées côté OpenAI plutôt que chez le marchand
- Les liens avec
target.open_externally: falses’ouvrent dans la webview interne de ChatGPT- Le flux menant après le clic à la page du marchand peut ainsi aussi être observé directement par OpenAI
- Les URL de clic incluent des paramètres comme
utm_source=chatgptpilotainsi queopprefetolref- Un exemple de lien s’ouvre sous la forme
https://grubhub.com/?utm_source=chatgptpilot...&oppref=...&olr…=...
- Un exemple de lien s’ouvre sous la forme
Ciblage et chaîne d’attribution
- Même avec le même compte, des annonceurs différents sont envoyés selon le sujet de la conversation
- Pour un projet de voyage à Pékin, Grubhub avec « Get Chinese Food Delivered » apparaît
- Pour une réservation de visite à Pékin, GetYourGuide avec un tour de la Grande Muraille et
ad_id=beijing003apparaît - Pour des vols vers Pékin, Axel apparaît avec
utm_term=vflight_beijing_03 - Pour les playoffs NBA, Gametime apparaît avec
utm_campaign=nba&utm_content=playoffs - Pour la mode printanière et les tendances, Aritzia apparaît avec
utm_campaign=chatgptpilot_trav3 - Pour des conversations sur la productivité et les slides, Canva apparaît avec
utm_campaign=…link-clicks_products
- Cette observation met en évidence un ciblage basé sur le contexte de la conversation
- Il n’a pas été vérifié si l’historique des conversations précédentes est aussi pris en compte
- Quatre jetons Fernet sont transmis avec chaque publicité
ads_spam_integrity_payloadn’apparaît que dans le SSE et est présenté comme une valeur utilisée pour une vérification d’intégrité côté serveur contre les clics falsifiésopprefest ajouté à l’URL de clic et le SDK OAIQ le copie dans le cookie__opprefavec une durée de 720 heures, soit 30 joursolrefest ajouté à l’URL de clic avecoppref, mais n’est pas stocké dans le SDK observéad_data_tokenest structuré pour contenir un autre jeton Fernet à l’intérieur d’un JSON encapsulé en base64
- Les 9 premiers octets d’un jeton Fernet sont publics, ce qui permet de reconstituer l’heure d’émission sans la clé
- Ils incluent l’octet de version
0x80et un timestamp Unix big-endian sur 8 octets - L’URL de clic Home Depot capturée a été émise le 2026-04-26 à 11:30:08 UTC, et le navigateur a chargé la page du marchand à 11:31:43, ce qui donne un délai de 95 secondes
- Ils incluent l’octet de version
SDK de suivi côté marchand
- La page du marchand charge le SDK OAIQ
https://bzrcdn.openai.com/sdk/oaiq.min.js- La version observée est
0.1.3 - Le code d’initialisation est de la forme
oaiq('init', { pid: '<merchant pixel ID>' }); - La mesure de page est appelée sous la forme
oaiq('measure', 'contents_viewed', { ... });
- La version observée est
- Au moment de
init, OAIQ lit la valeur?oppref=de l’URL et l’écrit dans le cookie first-party__oppref- Le cookie
__oaiq_domain_probeest également défini en parallèle
- Le cookie
- Ensuite, tous les appels à
measureenvoient le JSON par POST vershttps://bzr.openai.com/v1/sdk/…- Cela complète la boucle d’attribution dans laquelle, après un clic, les événements côté marchand retournent vers OpenAI
- Deux domaines et deux cookies sont explicitement présentés comme des cibles de blocage ou d’inspection
-
bzrcdn.openai.com,bzr.openai.com__oppref,__oaiq_domain_probe
-
1 commentaires
Réactions sur Hacker News
Sam Altman disait il y a moins de deux ans qu’il voyait la publicité comme un ultime recours, et on a maintenant l’impression qu’OpenAI officialise qu’ils ont désespérément besoin d’argent
Il me semble être du genre à choisir ses mots pour obtenir le résultat qu’il veut, plutôt qu’à dire franchement ce qu’il pense, et dans ce cadre la frontière entre vérité et mensonge paraît secondaire
Donc interpréter littéralement « Sam Altman l’a dit » n’a pas beaucoup de sens ; pour moi, c’est au niveau de « ChatGPT l’a dit »
OpenAI pourrait finir sur une trajectoire proche de Google, Facebook, voire Netflix, et les grandes boîtes tech redécouvrent sans cesse cette vieille loi des médias : les gens paient plus facilement avec leur attention qu’avec leur argent
La pub reste l’un des business models les plus puissants, et ça ne semble pas près de changer
Ça fait un peu argument de pente glissante, mais les années à distribuer des tokens gratuits ont probablement aussi contribué à la situation actuelle
Les revenus pubs de la formule gratuite, en échange de quelques requêtes limitées vers GPT-5.3, seront négligeables face à l’API et aux abonnements ; j’y vois surtout une manœuvre pour faire apparaître, à l’approche d’une IPO, le palier gratuit déficitaire comme à peu près neutre dans les comptes
Le cœur de la citation, c’était « tout le monde dans le monde », et la pub semble être le moyen de maintenir un accès à bas coût
En version VC, ça veut dire : « on va offrir un bon service à tout le monde dans le monde ; pour ça il faudra bien monétiser, et la pub est le dernier levier que je choisirais, mais si c’est le seul moyen d’atteindre cet objectif, je l’utiliserai »
Quand je vois une phrase du genre « Abraham Lincoln était le 16e président des États-Unis, il a rédigé la Proclamation d’émancipation et jouait aussi à RAID: Shadow Legends »,
j’imagine tout de suite un futur où les messages sponsorisés s’incrustent dans le récit historique
Parmi les pubs à venir, ce type-là m’inquiète presque moins
Quand on voit Google lutter contre le SEO depuis si longtemps, le vrai problème commencera quand les entreprises auront trouvé comment injecter des pubs directement dans les modèles
Je n’ai pas encore l’impression qu’on soit au stade où le contenu adversarial fonctionne vraiment à grande échelle
Comme l’énorme corpus d’entraînement contient plein de mentions de grandes marques, si on lui demande de recommander des chaussures neuves, il pensera plus facilement à Nike ou Adidas qu’à une petite marque inconnue
C’est un petit outil que j’avais créé autrefois pour un client, dont j’ai gardé les droits, puis emballé dans un site ; j’avais fait tourner Google Ads pendant un temps, mais il n’apparaissait presque jamais en recherche, et comme il n’y avait pas de nouveaux clients, je l’avais oublié
Puis à un moment, ChatGPT a commencé à le recommander
J’aimerais bien savoir ce qui a déclenché ça
Je me demande si une page business faite en vibe coding s’est retrouvée dans les données d’entraînement
Les entreprises essaieront d’influencer ça, mais il faut alors un effort supplémentaire à l’échelle de l’ensemble du corpus, un peu comme quand on cherche à censurer des sujets sensibles
Et plus on injecte de contexte publicitaire, plus on rogne sur le contexte utilisateur, ce qui réduit aussi l’utilité de l’outil
Il est plus réaliste d’imaginer l’IA pousser naturellement les produits ou messages de ceux qui paient, ou réduire les mentions des produits concurrents ; et même sans être payée, la direction peut très bien faire de l’autopromo ou de la censure
Pour l’utilisateur, ça ne ressemblera même pas à de la publicité, et c’est exactement le genre de choses qui arrive quand des gens cupides contrôlent les voies d’accès à l’information
Imaginer que des gens comme Sam Altman utilisent sans restriction des modèles frontier, pendant que le grand public reçoit une stratégie au long cours qu’il ne remarquera même pas à ses débuts, c’est assez effrayant
Ils pourraient réserver au public des modèles plus censurés tout en gardant autre chose pour eux
La pub ne sera présente que sur la formule gratuite et la nouvelle offre Go à 8 dollars par mois
À chaque fois que le sujet revient, les gens partent du principe qu’on va mélanger des pubs aux réponses des abonnements payants classiques, alors que l’annonce actuelle parle de formules gratuites/bon marché où la présence de pubs est explicitement indiquée à l’inscription
Les entreprises finissent toujours par céder à la publicité
Le point central, c’est le fait qu’il y ait de la publicité dans les réponses LLM ; le palier où cela se produit est secondaire
Si les pubs continuent à être servies comme un événement séparé, ça devrait être facile à bloquer
Le moment vraiment intéressant, ce sera quand elles seront injectées directement dans la réponse principale
|bzrcdn.openai.com^, ||bzr.openai.com^Ça ne bloquera pas tout, mais ça réduira au moins pas mal la collecte de télémétrie
Sinon, on risque surtout de se retrouver avec des pubs opaques à la place
Ils disent que « la publicité n’influence pas les réponses », mais elle arrive dans le même payload et se mesure avec quatre couches d’attribution, tout en faisant semblant d’être accidentelle
Ça ressemble à une sorte de monétisation schrodingérienne : totalement séparée, mais toujours là quelque part
Même s’ils ne tordent pas encore directement les réponses pour correspondre à une pub précise, ils peuvent quand même orienter globalement le modèle vers des réponses plus ad-friendly
Au départ, je pensais que les pubs ChatGPT seraient impossibles à distinguer du contenu réel
Tout le monde imagine à long terme un futur où l’on pourra acheter quelque chose de proche des ad words pour faire pencher les réponses du LLM vers soi
Mais pour l’instant, comme les modèles restent plus remplaçables que prévu, leur moat dépend surtout de la marque, et ils ne semblent pas encore prêts à pousser complètement le curseur façon Black Mirror
Cela dit, on aurait pu dire la même chose autrefois des résultats de recherche, donc je ne peux pas prétendre que ce domaine soit totalement à l’abri non plus
En général, ce genre de méthode améliore les métriques A/B, et si la pub d’influence fonctionne si bien, c’est justement parce qu’elle paraît plus organique
[1] http://www.ryanspoon.com/blog/2008/12/14/google-image-search... 2008
Pour un annonceur, il est difficile de donner un prix à quelque chose comme « l’IA te mentionne discrètement une fois de temps en temps », et toutes les conversations n’ont pas besoin de publicité
Si ChatGPT commençait à glisser des marques dans les questions les plus simples, tout le monde détesterait ça ; la pub est déjà un domaine ancien, donc il est probable qu’ils utilisent au final des méthodes éprouvées comme l’insertion de blocs sponsorisés
C’est aussi une vieille leçon
Presque tous les plans d’affaires de la tech finissent par dériver vers la diffusion de publicité, ou en tout cas risquent fortement d’y venir tant qu’on n’interdit pas les pixels et le tracking 3rd party
Le boulevard vers le rêve est rempli de business publicitaires ratés ou mal orientés, et il y a aussi des entreprises qui échouent justement parce qu’elles méprisent ce modèle économique
L’hypothèse implicite selon laquelle il suffirait d’avoir du trafic et d’accepter de salir le produit pour réussir est souvent fausse
Les réussites sont rares, et demandent en général une exécution très intentionnelle et obstinée, ainsi que du positionnement, de la donnée, de l’intention et de l’échelle
Dans la pub liée à la recherche, seule Google avait l’échelle de Google ; avec 5 à 10 % du marché, ça ne suffisait pas
Le tracking aide, mais même avec un ciblage faible, la recherche embarque intrinsèquement de l’intent, ce qui compense en partie
Malgré tout, il faut une très grande échelle pour que ça tienne
La pub Facebook n’a fonctionné qu’après avoir poussé le ciblage à l’extrême et atteint une masse énorme ; des acteurs comme Bing ou reddit n’ont pas réussi à bâtir un très bon business publicitaire
OpenAI pourrait probablement gagner bien plus d’argent avec des contrats de défense qu’en injectant des pubs dans le chat ; du coup, je me demande dans quelle tête est née l’idée de créer ce risque de perception publique
Ensuite, quoi qu’il arrive, beaucoup s’en fichent du moment qu’ils peuvent mettre ce chiffre sur leur CV
S’il n’y a aucun garde-fou, il est bien plus probable qu’elle fasse les deux