- L’encyclopédie en ligne Wikipedia a récemment annoncé que les visites directes diminuaient en raison des résumés de recherche par IA et des vidéos des médias sociaux.
- La Wikimedia Foundation a indiqué que le nombre de visiteurs humains avait chuté de 8 % par rapport à l’an dernier, résultat du comptage basé uniquement sur le trafic humain réel après la mise à jour de son système de détection des bots.
- Les résultats de recherche génératifs de l’IA fournissent directement les réponses, ce qui réduit les clics vers les sites web ; les jeunes générations ont tendance à utiliser des plateformes de vidéos sociales comme TikTok pour la recherche d’informations.
- Wikipedia a arrêté en interne les expériences de résumé IA et estime que les entreprises d’IA et les moteurs de recherche doivent assumer la responsabilité de mentionner les sources et d’inciter à la visite.
- En rappelant que “la source de connaissances utilisée par l’IA reste un contenu créé par des humains”, elle souligne l’importance de vérifier des sources fiables et de reconnaître la valeur de la curation humaine des connaissances.
Baisse du trafic de Wikipédia
- Wikipedia est souvent citée comme l’un des derniers grands sites web réellement fiables sur Internet.
- Selon un rapport récent publié par la Wikimedia Foundation, les vues de pages d’utilisateurs humains ont diminué d’environ 8 % par rapport à la période équivalente de l’année précédente.
- La fondation a amélioré son système de surveillance pour distinguer plus précisément le trafic humain de celui des bots, et a constaté qu’une part importante du trafic exceptionnellement élevé observé en mai et juin provenait d’un trafic de bots évitant la détection.
- Selon Marshall Miller de la Wikimedia Foundation, ce phénomène serait un changement structurel lié à la hausse des résumés de recherche IA et de la consommation de vidéos sur les médias sociaux.
- Les moteurs de recherche passent progressivement à l’affichage de réponses générées directement par l’IA, au lieu de liens vers les sites.
- Les jeunes générations utilisent des plateformes vidéo comme TikTok et YouTube Shorts pour la recherche d’informations, plutôt que l’open web.
- Google a répondu en affirmant que la recherche IA ne réduit pas le trafic.
Position et réponse de Wikipédia
- Miller dit que « il est positif que les gens acquièrent des connaissances de nouvelles façons », et rappelle que les contenus de Wikipedia sont encore utilisés comme matériau de formation et de synthèse pour les modèles d’IA.
- La baisse de la fréquentation comporte toutefois un risque concret pouvant entraîner une réduction du nombre de bénévoles qui contribuent et gèrent le contenu, ainsi qu’une baisse des dons.
- Certains éditeurs ont d’ailleurs soulevé des problèmes de qualité avec des résumés générés par l’IA, et la fondation a suspendu son programme pilote de résumé IA.
Redéfinir la relation avec les entreprises d’IA
- Miller affirme que les plates-formes IA, de recherche et sociales qui utilisent le contenu de Wikipedia doivent contribuer à l’écosystème en indiquant la source et en orientant les utilisateurs vers le site.
- Wikipedia développe un nouveau cadre de mention des sources, et fait fonctionner deux équipes spécialisées pour attirer de nouveaux publics.
- Elle mène également une campagne pour renforcer la participation des bénévoles.
L’importance d’un savoir fondé sur la confiance
- Miller souligne que “la source des informations résumées par l’IA inclut inévitablement du travail cognitif humain”.
- Les utilisateurs devraient, au moment de la recherche, vérifier les citations et consulter directement la source originale.
- La préservation d’un écosystème de connaissances fiables et humanement curaté est nécessaire.
- Il a déclaré que « la transparence de la provenance des connaissances et la continuité de la participation humaine sont des valeurs clés à l’ère de l’IA ».
3 commentaires
Si les modèles d’IA et les entreprises qui les créent ne font pas d’efforts pour établir la confiance,
Wikipédia pourrait, à long terme, offrir davantage d’opportunités de croissance.
Il est devenu un site qui ne sert qu'à voler les données.
Avis de Hacker News
Je pense que Wikipédia est nécessaire, et une baisse du trafic en elle-même n'est pas un problème. Les encyclopédies papier ont été remplacées par Wikipédia, mais l'IA ne peut pas prendre sa place. L'IA n'est qu'un outil qui facilite l'accès, tandis que Wikipédia a un objectif et une valeur qui lui sont propres. J'ai toujours été sceptique quant à l'accumulation de fonds du Wikimedia Foundation et à l'augmentation continue des dépenses annuelles. C'est précisément le bon moment pour économiser et investir afin de devenir autonome, et espérer atteindre 1000 ans. Je pense que Wikipédia est un bien pour le bien commun et qu'elle doit être gérée en ce sens.
Je pense que le Wikimedia Foundation aura du mal à survivre 1000 ans. Je pense que c'est parce que le système social et économique lui-même ne durera pas aussi longtemps. On voit déjà le gouvernement américain adopter des attitudes inconfortables envers Wikimedia. Changer de pays ne rendrait pas ce genre de longévité beaucoup plus probable. En raison de la fragilité de la civilisation technique et de la conservation des données, il est incertain que Wikipédia puisse subsister si longtemps. article connexe
Wikipédia met à disposition des dumps de données publics, donc il doit exister de nombreuses copies hors ligne. Je pense que le fait que Wikimedia parle de baisse du trafic n'est probablement pas lié à des raisons commerciales de ventes publicitaires. Cela tient sans doute au fait que la manière dont les utilisateurs de www recherchent l'information a changé. Si un site ne vend pas ses utilisateurs, une baisse de trafic n'est pas un problème. Cela ne signifie pas que l'information qu'il propose est moins précieuse.
À long terme, j'ai toujours été intrigué par la stratégie consistant à accumuler des fonds et des investissements pour survivre. Si une telle diversification permet d'opérer même si les revenus externes cessent, on pourrait se concentrer sur sa vision initiale et sur ce qui est juste, sans être prisonnier des résultats trimestriels. On peut gagner de l'argent tout le temps, mais il est idéal d'envisager une stratégie de long terme en préservant l'essentiel.
Wikipédia est vraiment exceptionnelle. N'importe qui dans le monde peut écrire sur n'importe quel sujet. On peut être sûr d'obtenir de bonnes informations.
Je suis curieux de savoir comment Wikimedia Foundation utilise ses fonds. On dit que les dépenses augmentent sans cesse, mais où vont-elles principalement ? Continuent-ils à essayer de se développer avec d'autres projets ? Je comprends que le coût d'hébergement d'un site mondial est loin d'être négligeable, mais je me demande si cela a vraiment explosé à ce point.
S'agissant d'une organisation à but non lucratif 501(c)(3), si le trafic web n'a pas d'impact direct sur les revenus, je me demande s'il faut vraiment considérer la baisse de trafic comme un mauvais signal. Je pensais que la pression d'une croissance soudaine concernait surtout les entreprises dépendantes du capital-risque ou de la publicité.
En réalité, Wikipédia dépend aussi fortement du trafic web. Le nombre de visiteurs humains baisse, mais les crawlers IA vont chercher énormément de données, ce qui fait grimper les coûts.
Une baisse du trafic peut mener à une baisse du nombre de bénévoles et de donateurs. Si les visiteurs directs diminuent, il y a une inquiétude quant à la réduction des personnes qui peaufinent le contenu ou soutiennent financièrement.
Le signal pourrait ne pas être la baisse des revenus publicitaires, mais une baisse potentielle des dons. Aujourd'hui, beaucoup de gens paient pour des abonnements IA tout en ne visitant plus du tout Wikipédia. L'information première source est consommée par l'intermédiaire d'étapes intermédiaires. C'est similaire aux discussions sur la contrefaçon, sauf qu'aujourd'hui ce ne sont pas des particuliers, mais de grandes entreprises à but lucratif.
J'ai l'impression que les LLM ont remplacé 90 % des informations qu'on cherchait sur Wikipédia. C'est parce qu'ils peuvent intégrer des sources beaucoup plus variées. En même temps, je continue à contribuer (éditer) sur Wikipédia. Si les informations que j'ai éditées sont consommées depuis Wikipédia ou via un LLM, l'essentiel est qu'elles aident quelqu'un. Wikipédia ne disparaîtra pas même si les gens cessent d'en consommer directement l'information.
À un niveau réaliste, je pense que les LLM vont finalement remplacer Wikipédia totalement. En mettant de côté les problèmes de bureaucratie stricte, d'obsession éditoriale et de biais de Wikipédia, Wikipédia était déjà à la base un moteur de synthèse humaine qui agrège des sources secondaires pour construire du consensus. C'est précisément cette partie que les LLM maîtrisent le mieux. En entraînant sur de bons livres, on peut aussi dépasser la qualité de Wikipédia. Même une seule phrase de résumé IA met immédiatement le sujet principal en évidence. À l'inverse, Wikipédia tend parfois à rendre sa première phrase inutilement complexe à cause de conflits politiques entre rédacteurs.
Même si toutes ces affirmations étaient vraies, les LLM auront besoin d'un dépôt qui regroupe ce type de synthèses de sources secondaires. Les LLM ne peuvent pas chercher et lire en temps réel des milliers de sources secondaires. Beaucoup de ressources ont déjà disparu ou ne sont pas encore numérisées. Dans le futur, il est possible d'imaginer des laboratoires de recherche LLM faisant des dons à Wikipédia et proposant, via des agents IA, des suggestions d'édition et de vérification des faits.
Même avec cette idée (les LLM qui remplacent), je pense que Wikipédia doit continuer à exister. Je souhaite qu'elle conserve son rôle en aidant les gens à développer une pensée critique pour ne pas se laisser duper.
Je ne suis pas d'accord avec l'affirmation « il suffit d'apprendre sur de bons livres ». En réalité, pour beaucoup de sujets de Wikipédia, il n'existe pas de bon livre. Et se demande aussi qui décide du critère de qualité d'un tel livre. La baisse de trafic n'est pas un problème propre à Wikipédia, elle touche d'autres sites web. L'IA provoque la disparition de la source d'information qu'elle utilise. C'est précisément l'âge d'or de l'IA en ce moment. L'époque suivante sera celle de moins de bonnes sources originales, plus de contenus générés par IA, et de l'apparition de sites visant à perturber les LLM. discussion connexe
La connaissance ne s'existe pas en soi ; c'est la manière dont les gens l'organisent. L'IA extrait le savoir existant et le rend de plus en plus pratique, mais la base de l'organisation de l'information et du savoir ne changera sans doute pas radicalement. En revanche, l'IA peut transformer la façon d'organiser dans les zones suivantes :
Quand plusieurs perspectives existent sur un fait, comment le présenter de manière équilibrée ? (de nombreuses discussions d'éditeurs me reviennent en tête)
À l'ère du smartphone et des réseaux sociaux, comment organiser et résumer le fait que de nombreuses personnes ordinaires enregistrent l'histoire ?
Comment concevoir des incitations qui incitent aussi bien les humains que les IA à contribuer ?
Comment préserver l'indépendance de Wikipédia (question géopolitique) Pour mémoire, j'ai déjà dirigé un service wiki en Chine. Le point le plus difficile a été de voir qu'il n'y a presque personne qui se demande sérieusement pourquoi le format wiki est nécessaire et doit durer, au-delà de la simple recherche d'information.
J'aime l'idée d'utiliser l'IA pour rendre Wikipédia meilleure. Il existe de nombreuses possibilités pour qu'un simple agent IA gère des tâches de petite taille. Par exemple, on pourrait aller sur toutes les pages des villes espagnoles dans Wikipédia en anglais, puis comparer et corriger avec Wikipédia en espagnol la population, le nom des marchés, etc., pour des informations plus précises. Si un agent rédige seulement un brouillon et qu'un éditeur humain le révise, les mises à jour fines des informations peuvent se faire efficacement.
Depuis que Google propose des résumés IA, un phénomène similaire apparaît sur presque tous les sites.
Même en admettant l'impact de l'IA, je m'interroge sur la signification de « vidéos sociales ». Est-ce que cela signifie que les gens regardent TikTok à la place de Wikipédia ? Ou que la recherche elle-même n'est plus utilisée ?
De fait, les moteurs de recherche les plus populaires en ce moment sont YouTube et TikTok.
Chez Gen Alpha, TikTok est le principal média pour obtenir informations et connaissances.
J'aimerais voir le même phénomène sur tous les sites web optimisés SEO. discussion connexe
Jusqu'ici, le nombre de contributeurs à Wikipédia a continué à diminuer. Si le nombre de lecteurs directs baisse, je pense que la baisse des contributeurs sera encore plus marquée. Je suis curieux de savoir si des expériences sont en cours pour améliorer, valider et compléter Wikipédia avec l'IA. À l'avenir, les débats et les guerres d'édition pourraient se transformer en affrontements entre agents LLM, mélangeant collaboration et compétition.
De nombreuses tâches de contributeurs pourront être prises en charge efficacement par des agents IA. Le point central reste la participation et la supervision humaines, ainsi qu'un système de filtrage des comportements malveillants.
Il existe une faille dans la structure actuelle. Quand un contributeur ajoute un nouveau contenu, un spammeur retire le lien d'un document légitime pour le remplacer par un lien spam. Les bots de Wikipédia suppriment alors ce contenu. Le contributeur finit par perdre toute motivation.
Wikipédia a été un outil magique en avance sur son temps, et sa valeur d'agrégateur d'informations de premier ordre reste valable. Je pense qu'elle survivra longtemps comme un ensemble de liens. La curation en temps réel (lors de la lecture) est bien meilleure, mais dans le passé c'était difficile, et aujourd'hui c'est possible à moindre coût, donc Wikipédia restera probablement source de données pour de nombreuses solutions de curation en temps réel. Le simple fait qu'il existe une telle base de données source améliore déjà considérablement l'utilité de nombreux outils IA. Je comprends les critiques visant l'angle unique d'un éditeur et les accusations de partialité, et je les comprends. Mais grâce à l'interface de chat des LLM, on peut interagir, comprendre le contexte et entrer plus en profondeur. Personnellement, je prends plaisir à participer au processus de construction d'une infrastructure de connaissance ouverte. Je ressens une vraie satisfaction à corriger même la plus petite erreur d'un article wiki. Il y a beaucoup de choses faciles à corriger de cette manière. Même une mauvaise information ajoutée par quelqu'un peut être repérée et rectifiée assez facilement. exemple d'article