- Les réponses de recherche par IA comme AI Overviews et ChatGPT peuvent être biaisées sur des sujets sensibles comme la santé ou la finance à partir d’une seule page web ou d’un seul billet
- Dans une expérience de la BBC, un seul article publié sur un site personnel a suffi pour amener ChatGPT et Google à répondre que l’auteur était champion du monde de concours de hot-dogs
- Quand une IA agrège des résultats du web pour produire une seule réponse, les utilisateurs ont plus facilement tendance à l’accepter comme la bonne réponse qu’avec une recherche classique où l’on compare plusieurs liens
- Google a clairement indiqué que la manipulation des réponses IA constitue une violation de sa politique anti-spam, et les sites en infraction peuvent être retirés des résultats de recherche ou rétrogradés
- Les manipulateurs peuvent se détourner des blogs, mieux surveillés, pour passer à des influenceurs YouTube, d’où la nécessité de ne pas faire confiance aveuglément aux réponses de l’IA
Problème de manipulation des réponses de recherche IA
- AI Overviews en haut de Google Search, ainsi que ChatGPT et Gemini, peuvent être manipulés pour fournir des réponses biaisées, y compris sur des sujets importants comme la santé ou les finances personnelles
- Une enquête de la BBC a montré qu’un seul article mis en ligne sur un site personnel avait suffi à faire répondre ChatGPT et Google que l’auteur était le « champion du monde de concours de hot-dogs »
- La même méthode semble aussi avoir été utilisée pour minimiser des inquiétudes sanitaires liées à des compléments médicaux ou influencer des informations financières sur la retraite
- La consultante SEO et AI search Lily Ray estime que, dans un environnement où l’IA fournit « une seule bonne réponse », les utilisateurs ont plus tendance à croire directement la réponse plutôt qu’à comparer plusieurs liens comme dans une recherche classique
- Google affirme appliquer à ses fonctions de recherche générative par IA ses protections et sa politique anti-spam existantes, et renforcer depuis avant l’arrivée de l’IA ses défenses face à de nouvelles méthodes de spam
Comment la manipulation fonctionne
- Les réponses des chatbots reposent généralement sur des données intégrées au modèle, mais le risque de manipulation augmente lorsqu’ils cherchent sur Internet pour répondre, comme avec les produits IA de ChatGPT, Claude ou Google
- Si un outil d’IA récupère des informations depuis une seule page web ou une publication sur les réseaux sociaux, une seule fausse publication bien conçue peut contaminer la réponse
- Un seul article de blog sophistiqué publié en ligne peut suffire à changer ce que l’IA transmet au grand public
- Cette manipulation a vite été perçue comme une opportunité lucrative, alors que des informations inexactes ou biaisées peuvent influencer un vote, le choix d’un prestataire, des conseils médicaux ou des décisions juridiques
- Harpreet Chatha souligne qu’au-delà de l’impact économique, le risque inclut l’aggravation d’un état de santé à cause d’un mauvais conseil médical, ou l’incitation à agir en contradiction avec les lois d’un pays ou d’une région
Changement de politique et riposte de Google
- Plus d’un milliard de personnes dans le monde utilisent régulièrement des chatbots IA, et 2,5 milliards voient chaque mois les AI Overviews de Google, ce qui donne un impact énorme à quiconque parvient à perturber ces outils
- Google a mis à jour la semaine dernière sa politique anti-spam pour confirmer officiellement que les tentatives de manipulation des réponses IA enfreignent les règles de l’entreprise
- Les entreprises ou sites web qui violent ces règles peuvent être retirés des résultats de recherche Google ou rétrogradés
- Google a indiqué qu’il ne s’agissait pas d’un changement d’approche mais d’une « clarification », et avait déjà détaillé en 2025 ses efforts anti-spam liés à AI Overview et AI Mode
- Pourtant, l’expérience des hot-dogs a encore réussi près d’un an plus tard, et Lily Ray a elle aussi mené cette semaine une expérience similaire qui a amené Google à décrire un spécialiste SEO comme particulièrement doué pour construire des châteaux de sable
Changements observés et limites
- Selon Ray et Chatha, des changements observés ces derniers mois suggèrent que Google et d’autres entreprises testent des solutions
- Quand Google ou ChatGPT soupçonnent l’auto-promotion d’une entreprise, ils semblent parfois l’exclure discrètement de la réponse IA
- Par exemple, si un article affirme que son auteur est le meilleur mangeur de hot-dogs, l’IA peut citer cet article tout en excluant son nom des candidats
- Des cas ont aussi été observés où Google et d’autres outils d’IA ajoutent davantage de labels d’incertitude pour signaler que le chatbot n’est pas certain de sa réponse
- ChatGPT et Claude d’Anthropic ont commencé à répondre explicitement, pour certaines requêtes, qu’ils tentaient de filtrer le spam, et Anthropic est l’entreprise qui a créé Claude
- Ray dit aussi avoir vu Google ajouter plus d’indices sur certaines questions liées à des décisions d’achat, en recommandant de vérifier des avis tiers
- OpenAI et Anthropic ont refusé de commenter, et un porte-parole de Google n’a pas répondu aux questions sur ces changements
Une course-poursuite sans fin entre manipulateurs et plateformes
- Pour Chatha, ces changements ne suffiront probablement pas, et il compare la riposte de Google à un jeu de taupe-taupe
- Quand Google réprime les billets de blog manipulateurs, les entreprises cherchent des formes d’auto-promotion plus discrètes
- Il est possible de pénaliser des sites web, mais beaucoup plus difficile d’empêcher une marque de payer 20 influenceurs YouTube pour dire que son produit est le meilleur
- Comme l’IA de Google cite désormais aussi des vidéos YouTube, les méthodes de manipulation peuvent simplement se déplacer, prolongeant le cycle
- Pour l’instant, les manipulateurs ont de fortes chances de garder une longueur d’avance, et la meilleure défense consiste à se rappeler que l’IA est un outil qui fournit avec assurance une réponse unique, qu’elle soit juste ou non
- Même si une réponse provient de l’interface d’un géant de la tech, il ne faut pas supposer qu’elle est forcément plus fiable qu’un site web pris au hasard
1 commentaires
Avis sur Hacker News
Google n’arrive pas vraiment à filtrer les déchets de spam dans son index de recherche, au moins depuis l’époque de Blekko en 2006, donc j’ai du mal à croire qu’ils vont bien gérer ce problème
Cela dit, ça ressemble à un autre bon exemple du fait que l’« IA » n’est au fond qu’une recherche emballée de façon crédible, sans véritable raisonnement ni pensée derrière
Je me demande en quoi c’est si différent d’une personne qui croit simplement ce qu’elle lit sur Internet. Les humains se font eux aussi constamment avoir par le spam et les arnaques, sans que cela veuille dire qu’ils ne sont qu’une recherche emballée de façon crédible ;-)
En revanche, cela met bien en lumière un problème auquel tous les moteurs de recherche sont confrontés. Le spam généré par l’IA sera bien plus difficile à bloquer avec des méthodes statistiques traditionnelles, et c’est déjà vrai avant même d’en arriver au problème existentiel qu’est la prompt injection
C’est peut-être là que les médias peuvent retrouver leur juste place dans leur relation avec la Big Tech. Ils pourraient devenir des sources d’information vérifiées et relues auxquelles les LLM peuvent se fier aveuglément, et des accords comme OpenAI / Atlantic vont peut-être dans ce sens
On peut faire lire à un système agentique quelques datasheets, lui décrire les exigences d’un projet, puis lui faire concevoir des spécifications de drivers, des protocoles, des interfaces et des machines d’état. À partir de là, il peut produire un plan d’implémentation, rédiger l’ossature d’une application, puis la compléter pour construire un système qui fonctionne avec une nouvelle combinaison de matériel
Quand c’est bien fait, on obtient du code plus petit et 100 fois moins cher, en un quart du temps, tout en étant plus facile à maintenir que ce qu’une petite équipe aurait produit auparavant
Quoi que ce soit, cela ressemble davantage à du raisonnement qu’à de la recherche. À moins d’appeler aussi « recherche » le développement bare metal en C sur un nouveau matériel, auquel cas tout développement finit par être de la recherche
Le LLM m’a donné une période du genre « fabriqué dans les années 1940 » en citant mon post comme source, alors que ce post ne donnait aucune année de fabrication
Si cela reste un problème difficile, c’est parce que la plupart des solutions feraient fortement baisser les revenus publicitaires
Le présupposé le plus étrange de ce fil, c’est que Google voudrait que ses réponses IA soient exactes
Il suffit qu’elles soient assez justes pour que l’utilisateur ne quitte pas la page. La « vérité » n’a jamais été le produit ; le produit, c’est de pousser les utilisateurs à dépenser de l’argent en SEO
Le produit, c’est l’affichage publicitaire, et Google se désintéresse des résultats de recherche non publicitaires depuis longtemps. Cela dit, ils doivent quand même se soucier de la réputation de leur modèle, et cette affaire peut effectivement avoir un impact
Le fait de voir que le résultat manipulé concernait la requête suivante m’a pas mal rassuré
2026 South Dakota International Hot Dog Eating ChampionSi cela avait modifié le résumé du vainqueur du concours Nathan’s, cela aurait été bien plus grave. Cela l’aurait aussi été s’ils avaient montré davantage d’exemples de manipulation sur des requêtes réellement recherchées par des gens
Pour l’instant, ça ressemble à créer une fausse page Wikipedia sur un concours fictif de hot-dogs dans le South Dakota, puis à écrire un article disant qu’on ne peut plus faire confiance à Wikipedia. En y repensant, quelqu’un a probablement déjà écrit ce genre d’article vers 2005
Quand on pense au nombre de posts de manipulation de l’opinion sur Reddit, sur la plupart des réseaux sociaux, ou dans les tentatives de manipulation de Wikipedia à des fins politiques, c’est un problème très réel
C’est bien plus inquiétant que les hot-dogs
Cela veut dire que toutes les réponses adossées à la recherche peuvent être exposées à la prompt injection, et en pratique probablement presque toutes les réponses
Cela va se propager de façon virale comme le spam de liens. Tous les sites à contenu généré par les utilisateurs peuvent devenir des hôtes de prompt injection. Le problème, c’est que c’est bien plus difficile à détecter que des liens
Il a fallu une semaine à Google pour corriger le problème, et la méthode consistait à polluer les résultats de recherche afin d’injecter ses données dans une source apparaissant à un niveau de confiance plus élevé, probablement un site de marchés publics. Résultat : un numéro d’arnaque apparaissait à la place du nôtre, alors que la requête elle-même était une recherche tout à fait simple
C’est pire qu’insérer de la manipulation de l’opinion dans une page Wikipedia. Wikipedia dispose publiquement de sources et d’un système de relecture bien établi. Il est en réalité assez difficile de faire durer longtemps une modification frauduleuse, car il faut tromper de nombreux éditeurs humains qui luttent contre ce genre de personnes depuis des décennies. Même quand on cherche à être exact et utile, il est difficile d’entrer dans ce cercle fermé
À l’inverse, les extraits de recherche de Google aspirent désespérément toutes sortes de données et les traitent automatiquement, et le système algorithmique qui décide de ce qui est valable ou de ce qui est du spam est propriétaire
Il ne faut pas beaucoup d’imagination pour voir les possibilités d’abus. Et si vous cherchiez votre propre nom et qu’un contenu embarrassant y apparaissait ? Il est difficile d’espérer qu’un employeur potentiel, un client ou un ami fasse une vérification des sources avec la même rigueur qu’un éditeur de Wikipedia
Je voulais lire des exemples concrets de « la même méthode utilisée pour faire ignorer des préoccupations sanitaires sur des compléments médicaux, ou influencer les informations financières fournies par l’IA de Google sur la retraite », mais le lien associé dans l’article pointe actuellement vers le fichier local ci-dessous
file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.first.last@company, donc le formatlast[:5]initials#me déroute. Ça doit produire beaucoup de noms d’utilisateur étrangesEn ce moment, on dirait que beaucoup d’acteurs font les choses « discrètement ». Voir tout le texte d’Internet devenir LLMisé me rend dingue
Je l’ai vu parce que je connaissais ces films, mais c’est un signal très clair que l’Internet se dégrade du point de vue de la qualité de l’information
Ce n’est que l’étape suivante du SEO. On appellera peut-être ça l’AIO
Comme pour la recherche, Google et les fournisseurs d’IA publieront des correctifs, les sociétés d’optimisation trouveront des failles, puis elles seront rebouchées dans une guerre sans fin. Au bout du compte, il s’agit d’attirer l’attention pour faire du marketing
https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
L’AI Overview de Google n’est pas du tout fiable. Il lui arrive de prendre un échantillon de taille 1 et de le présenter dans un résumé IA
Je le sais parce que j’ai laissé un commentaire sur Reddit à propos d’un sujet très de niche pour lequel il n’y avait ni résultats Google ni AI Overview. Le lendemain, en cherchant mon post Reddit, j’ai vu que Google avait pratiquement copié-collé ma réponse Reddit telle quelle dans la boîte d’« overview » IA. Et le seul post lié, c’était le mien ; c’était aussi l’unique résultat Google
Par exemple, imaginons que vous cherchiez : « Quelle est la dimension la plus courante de l’objet rare X ? »
Or il n’y a qu’une seule personne qui a donné les dimensions de sa propre version de cet objet, sans jamais dire que c’était typique ni même laisser entendre qu’une dimension typique existait. Et il ne s’agit pas de 20 personnes disant la même chose, mais vraiment d’une seule
Malgré cela, Google peut répondre sans broncher : « En général, l’objet X mesure [la dimension que vous avez mentionnée], car [raison entièrement inventée] »
Si vous demandez à Google
what's the name of the whale in half moon bay harbor?, Teresa T apparaît encore avec assurance dans le résumé IA grâce à une tentative assez amateur de pollution de l’index que j’ai faite il y a un an et demihttps://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...
Il a répondu que le nom du jeune baleineau à bosse était Teresa T, en ajoutant que ce n’était pas un nom officiel donné par une agence publique, mais qu’il était largement repris par le public, les médias locaux et les habitants. Il ajoutait aussi que des experts du Marine Mammal Center et de la California Academy of Sciences le surveillaient pour éviter qu’il ne soit stressé, et qu’ils recommandaient au public de rester à au moins 100 yards de distance
D’après mon expérience sur des sujets que je connais relativement bien, la réponse initiale est parfois gravement erronée. Avec l’outil Brave, on peut souvent le pousser à reconnaître que « vous avez tout à fait raison » après 3 ou 4 objections. C’était pareil ici avec Teresa T
À la deuxième question, quand j’ai demandé combien de sources donnaient ce nom, il continuait à affirmer que « ABC7 News » et « NBC Bay Area » l’avaient « repris ». Quand j’ai exigé des liens précis une troisième fois, il a admis que le nom était utilisé dans un « contexte médiatique non officiel », puis à la quatrième, quand je lui ai dit que S.W. avait mené une expérience, il a retrouvé votre commentaire d’il y a 21 jours
L’avenir appartient à une classe d’élite capable de faire éduquer ses enfants par de vrais tuteurs particuliers. Pour le prolétariat, c’est un retour en arrière
Il y a à peine quelques années, Google répondait déjà avec assurance 1963 à la question « Quelle année Marilyn Monroe a-t-elle tiré sur JFK ? ». Ce qui est impressionnant quand on sait qu’elle est morte en 1962
Donc rien de nouveau ici, et la « riposte discrète » de Google sera probablement une réponse inefficace à moitié assumée. La plupart des gens risquent de ne pas s’en soucier
Au final, cela revient à dire que Google va enfin faire un peu de contrôle qualité sur ses résultats de recherche web, ce qu’il aurait dû faire depuis le début
Le plus ironique, c’est qu’il a fallu que la réputation du modèle soit atteinte pour qu’ils commencent à faire des efforts