Google déclare la guerre au Web
(tante.cc)- Google Search passe d’un modèle qui envoyait les utilisateurs vers des liens à un modèle centré sur des réponses traitées, créant ainsi une nouvelle couche contrôlable au-dessus du Web
- AI Overviews produirait des réponses erronées dans environ 10 % des cas selon une analyse, et Search renonce largement à fournir des liens vers les sources d’information
- Derrière l’emballage « IA » et « agentic », le cœur du système consiste à décontextualiser l’information, supprimer les sources, puis les remplacer par des réponses de LLM
- Les sites web et les créations se rapprochent moins de produits culturels à partager que de matières premières non rémunérées pour l’extracteur de texte synthétique de Google
- Les contre-mesures proposées sont le de-googlifying, l’évitement de Chrome et l’usage de moteurs de recherche alternatifs ; sinon, on risque de ne voir que les informations que Google juge pertinentes
La nouvelle couche d’abstraction que Google Search construit au-dessus du Web
- Le keynote de Google I/O peut se lire comme une offensive contre ce qu’il reste du Web, et l’explication de Google montre une orientation où Search pousse encore davantage vers des réponses traitées plutôt que vers la fourniture de liens
- Aujourd’hui, AI Overviews, les extraits IA de Search, feraient des réponses erronées dans environ 10 % des cas selon une analyse, et Google abandonne en grande partie le paradigme précédent qui consistait à fournir des liens vers les sources d’information
- Derrière les habillages comme « IA » ou « agentic », le cœur du dispositif consiste à décontextualiser l’information, retirer les liens vers les sources, puis produire une réponse générée par un LLM
- Google est en train de créer, au-dessus du Web, une nouvelle couche d’abstraction contrôlable qui tend à cacher les sites et les créations derrière les surfaces de Google, plutôt que d’en faire des destinations que les utilisateurs visitent et partagent directement
Les créations ne deviennent plus des produits culturels, mais des matières premières
- Les sites web, les textes et l’art conservent encore une certaine importance, mais leur valeur se rapproche désormais de celle de matières premières non rémunérées pour l’extracteur de texte synthétique de Google
- Les créateurs travaillent gratuitement, Google contrôle plus fortement les flux d’information, et peut orienter les réponses reçues par les gens dans le sens qu’il souhaite
- Les créations ne sont plus mises en avant comme des produits culturels importants que l’on peut partager avec d’autres, mais reléguées au rang d’entrées que Google traite et recombine
Un changement opposé au Web participatif
- Ce changement est présenté non comme une révolution vers un Web participatif, mais comme une contre-révolution contre le Web participatif et contre les utilisateurs eux-mêmes
- L’objectif serait de s’emparer du Web et d’amener les gens vers une couche d’abstraction au-dessus du Web que Google contrôle et orchestre
- Il s’agit d’un problème de monopole sur l’accès à l’information, décrit comme un véritable Metaverse qui s’éloigne des standards ouverts et de la capacité de chacun à construire un coin du Web selon ses besoins et ses désirs
- Étant donné la forte influence de Google sur les standards du Web, cette orientation pourrait même modifier la forme standard du paysage technique avec lequel le Web est construit
La possibilité d’un contrôle sous le nom de « Web sûr »
- À l’étape suivante, Google ou d’autres entreprises du même secteur pourraient créer et diffuser un nouveau terme péjoratif pour présenter le Web existant comme sale, incontrôlé, dangereux et mauvais
- Ce type de dénomination fonctionnerait à la manière du « Dark Web » et pourrait installer la surface abstraite de Google comme le Web sûr
Réponse : réduire la dépendance à Google
- Si l’on accorde de l’importance au Web et à la capacité des gens à y participer au-delà du simple rôle de consommateurs passifs, il faut prendre ce changement au sérieux
- Le de-googlifying, c’est-à-dire retirer Google de son outillage mental, devient plus urgent
- Il est proposé de chercher d’autres moteurs de recherche et de choisir de ne pas utiliser le navigateur Chrome
- Sinon, on risque de se réveiller dans un environnement comparable à un AOL dégradé, où l’accès à l’information serait limité à ce que l’extracteur de texte synthétique de Google juge pertinent
1 commentaires
Avis Hacker News
On a l’impression que l’IA est désormais arrivée au stade où « si l’on veut produire de l’art, du code, de la musique ou de l’écriture, on peut toujours le faire pour sa satisfaction personnelle, mais plus pour gagner de l’argent »
Gagner de l’argent avec du contenu semble n’être possible que pour les grandes entreprises, et dès qu’on publie une création, elle finit simplement redonnée à manger aux machines pour être copiée encore et encore
On dirait presque que le monde se divise en deux « sociétés » : d’un côté ceux qui aiment l’IA + les grandes entreprises + l’innovation et la disruption très rapides, de l’autre ceux qui préfèrent le travail artisanal + les petites structures + une innovation plus lente mais plus durable
Personnellement, je préférerais vivre dans la seconde société, mais je pense que les deux peuvent continuer d’exister et de se développer à leur manière
Bien sûr, des sociétés différentes finissent forcément par interagir et s’influencer mutuellement
J’ai vu un effet similaire dans l’hôtellerie. Les hôtels, booking.com et Google veulent tous gagner de l’argent, mais les clients cherchent en général « hôtel quelque part » sur Google, et Google vend de la publicité sur cette requête, ce qui fait que le plus offrant récupère l’essentiel du profit
Il faut taxer les profits excessifs des entreprises technologiques tirés des efforts des autres, et utiliser cet argent pour soutenir les artistes vivants
Cela ressemble vaguement aux prélèvements qu’on appliquait autrefois sur les cassettes vierges pour compenser le piratage. Sauf que l’argent devrait aller directement aux artistes eux-mêmes, et non aux labels ou aux éditeurs
Pour ce type de « client », ce n’est guère différent d’encadrer un poster de la Joconde
Plutôt que de menacer les artistes, l’IA pourrait au contraire rendre les œuvres originales encore plus précieuses et plus agréables à apprécier
Pour essayer de contrer ça, il y a un mois ou deux, j’ai mis la majeure partie de mon site de recherche sur Amazon Redshift derrière une authentification basique par identifiant/mot de passe
Tout reste gratuit, mais il faut maintenant m’envoyer un e-mail pour obtenir l’identifiant et le mot de passe
J’ai passé du temps à créer ce contenu, et si des entreprises comme OpenAI le copient pour le vendre via des LLM, au point que plus personne ne vienne sur mon site, alors je n’ai plus aucune raison de produire ce contenu. Dès lors, il n’y a plus rien à prendre pour OpenAI, plus rien à lire pour les autres, et tout le monde y perd
C’est parasitaire, et cela ressemble en apparence à une manière de tuer l’hôte. J’ai presque l’impression qu’on abandonne la notion de propriété privée
Des entreprises d’IA peuvent prendre ce que j’ai créé sans mon consentement et le vendre à profit, alors qu’une part importante de ce profit semblait auparavant me revenir comme contrepartie de mon travail
J’ai cherché comment signaler aux entreprises d’IA qu’elles devaient retirer mon contenu, mais les mécanismes proposés ne sont que des dispositifs de façade qui me transfèrent la charge. Et je n’ai même aucun moyen de savoir si le retrait a réellement eu lieu. C’est du style : « si vous montrez qu’un prompt fait ressortir votre contenu, nous essaierons de prendre des mesures pour qu’il n’apparaisse plus »
Depuis que j’ai mis cette barrière identifiant/mot de passe, Google a fortement déclassé mon site, qui est désormais pratiquement introuvable dans les recherches
Je me demande aussi si, quand vous dites vouloir signaler aux entreprises d’IA de retirer le contenu, cela inclut aussi celles qui fournissent une attribution et des liens vers la source d’origine. Par exemple, Perplexity s’en sort plutôt bien là-dessus
Si l’accès au contenu est bloqué sans connexion, cela empêche aussi l’indexation par les moteurs de recherche, donc il est normal que Google vous rétrograde
J’ai un peu de mal à comprendre l’objectif final. Quand on met gratuitement du contenu sur le web, qu’est-ce qu’on gagne à empêcher l’indexation par l’IA, surtout si cela bloque aussi les utilisateurs réels, qu’il s’agisse d’IA ou de recherche traditionnelle ?
Je comprends la frustration de voir des outils d’IA digérer votre contenu puis le resservir aux utilisateurs sans les relier à votre site. Mais, indépendamment de l’IA, les humains ont toujours fait cela. Ils lisent un texte, apprennent des faits ou comprennent des idées nouvelles, puis intègrent ces informations dans leur propre travail sans nécessairement reconnaître ni même se souvenir de leur source
L’IA a accéléré ce processus et l’a rendu plus visible, donc je comprends la source de la frustration, mais l’idée que tout ce qui se passe en aval de mon travail devrait toujours m’être attribué n’a peut-être jamais été raisonnable dès le départ
Comme vous l’avez dit, eux aussi savent qu’ils ont besoin de bonnes données, donc ils essaieront peut-être réellement de trouver une forme d’équilibre
Sinon, les laboratoires d’IA finiront peut-être par produire eux-mêmes, en interne, le nouveau contenu de valeur à donner aux LLM. Ça paraît délirant, mais Netflix produit bien ses propres contenus
Les laboratoires d’IA vont probablement devenir si énormes qu’ils joueront un rôle qui dépassera largement la simple fourniture d’inférence LLM. Ils pourraient devenir aussi puissants que beaucoup d’États-nations actuels, voire davantage
J’ai du mal à comprendre quel est le stade final ici. Les sites web laissaient Google explorer leur contenu en échange de trafic
Si Google coupe complètement cela, je ne vois plus quelle incitation il resterait aux sites pour ne pas bloquer le crawler de Google
Je comprends qu’on puisse ressentir une menace existentielle venant d’autres produits IA qui fournissent directement des réponses, mais Google devrait aussi comprendre la relation de symbiose avec le web
Pourquoi acheter sur un site quelconque si Gemini peut le faire à votre place ? Pourquoi aller chercher une information sur Wikipedia… vous voyez l’idée
Les prochaines années me semblent décisives pour le web. Facebook avait essayé une stratégie comparable quand les apps ont pris de la puissance, et a fini par échouer. J’espère que Google échouera aussi
Si les sites cessent d’être publiés ou explorés, de quoi les machines vont-elles continuer à se nourrir pour tourner ?
Donc, dans leur tête, rien ne change, sauf que le lecteur n’est plus un humain mais un bot. Pour quelqu’un qui écrit, c’est atroce
Cela fait longtemps que nous avons laissé à Google le soin d’envoyer du trafic vers les sites web
Principalement parce que Google le faisait si bien que les alternatives sont devenues bien moins utiles
Maintenant que Google cherche, pour ainsi dire, à devenir « autosuffisant », il faut trouver une meilleure manière d’envoyer du trafic vers les sites web. Idéalement, d’une façon qui ne soit pas sous le contrôle d’une seule entreprise
Il y a des nostalgiques de StumbleUpon ?
Vu la nature du problème, c’est probablement normal, mais autrefois il y avait aussi beaucoup d’idées décentralisées absurdes totalement inadaptées
Les sites qui regroupent bien les liens sont bien plus utiles pour découvrir de nouveaux sites web
En tant qu’exploitant de site web, j’ai bien constaté une forte hausse des pages vues, mais voir des résumés IA faux avec mon site cité comme source est vraiment dévastateur
Cette tendance à forcer l’IA partout finira sans doute par faire baisser le niveau de compétence général, et cela m’inquiète parce qu’on ne voit pas comment l’arrêter
Aujourd’hui, j’ai demandé à un développeur comment notre produit était programmé pour gérer une certaine situation, et il m’a simplement renvoyé le résumé de l’assistant IA interne qu’il vient de commencer à utiliser
Avant, il donnait de très bonnes réponses, réfléchies ; maintenant, c’est juste du copier-coller de réponse IA
Apparemment, ils n’aiment pas tant que ça être eux-mêmes scrapés : https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...
Je crois que ce serait plus triste si le web n’était pas déjà aussi pourri à la base
En moyenne, quand on arrive sur un site au hasard, il ne cherche qu’à vous balancer de la pub et à vous harceler pour vous faire vous abonner
Je ne comprends pas pourquoi ce genre de modale n’est pas considéré comme une popup
La structure d’incitation des moteurs de recherche favorise le contenu récent au détriment du bon contenu, donc tous les sites se mettent à déverser des choses qui ressemblent à des déchets générés en continu
À ce stade, si je vois dans un résultat de recherche un horodatage datant des deux dernières années, j’ai tendance à considérer que c’est de la camelote et à ne pas cliquer
La réponse, c’est peut-être Kagi. Là-bas, je ne suis pas le produit, je suis le client
Honnêtement, tous les sites ne sont pas comme ça, il existe encore de bons endroits. Mais les moteurs de recherche ne vous y amènent jamais. Ils ne montrent que des ordures toute la journée
Même si cela aurait peut-être fini par arriver avec quelqu’un d’autre, dans les faits c’est Google qui l’a fait, et qui a empoisonné le puits dont nous buvons tous
Arrivé à peu près au milieu de l’article, il y avait trois énormes bannières publicitaires qui occupaient le haut, la droite et le bas, prenant plus de place que le corps du texte, et dans le coin inférieur droit flottait une pub vidéo en lecture automatique qui masquait l’essentiel de l’une des bannières
La pub « dynamique » au milieu de l’article se dilatait puis se rétractait soudainement, provoquant des saccades qui empêchaient effectivement de lire quoi que ce soit
Et c’est, à ce niveau, l’une des expériences relativement meilleures qu’on puisse avoir en lisant un blog moderne ou assimilé. On se rapproche presque d’un site porno douteux
C’est triste et pathétique
Ce genre de déclaration me parle rarement, parce qu’elle ne correspond pas à mon modèle du problème
Je suis quelqu’un qui tient un blog, ou dans les termes d’aujourd’hui un « producteur de contenu », mais je suis aussi utilisateur
En tant qu’utilisateur, je veux que l’agent utilisateur de mon navigateur affiche des pages web pour moi, et je veux qu’un agent de recherche extraie des informations de plusieurs sources et les synthétise avec une attribution appropriée
On pourrait objecter que, comme ma production de contenu est un hobby, cela me rend indifférent à l’intermédiation des plateformes. C’est en partie vrai. Si j’en vivais, je pourrais conclure qu’un comportement qui détruit mes revenus est une guerre contre le « web »
Mais pour un observateur neutre, même s’il s’agit d’une guerre, il faudrait dire que c’est une guerre contre ma façon de participer au web, à savoir la création de contenu à des fins de revenus, de notoriété ou de récompense
Comme utilisateur, je ne me soucie pas tant que ça de chaque site web ou de chaque créateur. L’information qu’ils contiennent m’est utile, mais l’hétérogénéité des sites constitue le plus souvent un obstacle à l’accès à l’information
Si des agents de recherche et de synthèse pouvaient agréger fidèlement ce que disent ces sites web pour rendre mon modèle du réel plus exact, j’en serais bien plus satisfait
Donc je peux être convaincu par l’argument selon lequel l’évolution de Google réduit les chances que du contenu exact soit produit, et augmente la probabilité que je sois plus souvent induit en erreur. Mais cela reste un outil, et mon modèle du monde sera fréquemment vérifié par la réalité
Si une machine de recherche et de synthèse ne produit pas de résultats utiles, je finirai par le savoir, et je devrai ajuster ma manière de traiter cette connaissance pour éviter des conséquences graves. Mais c’est déjà le cas aujourd’hui
Je ne peux déjà pas savoir si les résultats Google sont des résultats manipulés pour changer mon opinion, ni si Google ne fabrique pas une fausse impression de consensus en connivence avec Internet Archive
Comme utilisateur, je dois déjà prendre beaucoup de décisions, et lire péniblement les résultats de recherche pour en faire moi-même la synthèse est bien moins utile que d’utiliser un agent
Donc, s’il y a une guerre contre le web, j’y participerai volontiers. Du côté opposé au web
Un résumé de scénario peut aider à décider si l’on veut voir un film, mais ce n’est pas un substitut au fait de voir réellement le film
Que l’IA réponde à des requêtes comme « 50 usd in eur » ou « current weather in Paris », très bien. Pour tout ce qui est plus complexe, je préfère de très loin obtenir les vrais liens vers les sources
L’aspect optimiste, c’est que cela ressemble à une poussée supplémentaire dans une direction que le « web » suivait déjà depuis longtemps : celle qui empêchait les utilisateurs d’obtenir honnêtement et efficacement les bonnes informations, tout en préservant leur budget d’attention et leur liberté de choix
Jusqu’ici, cela passait par l’ajout de bruit au nom d’incitations financières ; maintenant, cela passe par la suppression du bruit au nom de ces mêmes incitations
Ce qui me rend optimiste, c’est que jusqu’à présent il n’y avait pas d’ennemi unique, donc il était difficile de lutter contre un système relativement diffus ; désormais, Google aggrave clairement les choses et se désigne, avec quelques autres entreprises, comme une cible identifiable
J’espère que cela fera dépasser leur seuil de tolérance à davantage de gens, au point de les pousser soit à revenir vers le « vieux web » d’avant Google et les régies pub, soit à trouver de nouvelles manières d’accéder plus librement les uns aux autres et aux contenus
Ce ne sera ni petit ni facile. C’est en grande partie un combat contre l’état actuel du capitalisme lui-même, et pour reprendre le contrôle de notre attention, de notre esprit critique et de notre liberté de choix
Ils devraient payer les propriétaires de sites web dont ils utilisent les données
À ce stade, je ne sais même plus si c’est forcément une mauvaise chose
Le web est tellement saturé de déchets SEO qu’il faut peut-être que Google s’en retire pour qu’un nettoyage à la Usenet ait lieu
Les fonctions IA me disent en général directement ce que je veux savoir et, si je veux vérifier, elles fournissent souvent aussi des liens vers les sources. Le mode traditionnel par liens fonctionne encore
Les gens qui disent que c’est inutilisable ont généralement du mal à donner des exemples concrets de choses qu’ils n’ont réellement pas réussi à trouver
J’ai moi aussi vu quelques zones de faiblesse. Les documents anciens et ambigus semblent poser problème à la plupart des moteurs de recherche, et pour tout ce qui touche au piratage, on peut utiliser Yandex