6 points par GN⁺ 2024-01-12 | 1 commentaires | Partager sur WhatsApp

Internet est désormais un espace où les machines parlent entre elles

  • Internet est passé d’un usage simple où les gens se posaient des questions et se répondaient, à un espace désormais rempli de fausses informations générées par l’IA.
  • Des utilisateurs de Google ont découvert que Google affirmait à tort que les œufs peuvent fondre. Cela résulte du fait que Google, au lieu d’afficher directement des sites web, fournit des instantanés de pages dans des menus déroulants, ce qui permet aux utilisateurs de lire les résultats de recherche sans cliquer.
  • Ces derniers temps, l’inutilité de la recherche Google s’accentue. Par exemple, une recherche sur la sinusite chronique peut renvoyer des résultats concernant un pénis enflammé.

« Vol » du trafic Internet et polémique autour des articles IA de Sports Illustrated

  • Hier, un utilisateur de Twitter a affirmé pratiquer le « vol » du trafic Internet. Il a consulté l’index du site d’un concurrent, en a extrait les URL des articles, puis a utilisé l’IA pour rédiger rapidement des articles.
  • Il est également apparu que Sports Illustrated avait publié des articles écrits par l’IA, sous les noms de personnes qui n’existent pas en réalité. Après des demandes d’explication à ce sujet, ce contenu a été supprimé.

La destruction fondamentale d’Internet

  • Internet n’est plus un lieu de communication entre humains, mais s’est dégradé en un espace où les machines parlent entre elles.
  • L’expression « demande à Google » n’a désormais plus de sens. La probabilité d’obtenir des informations erronées ou totalement fictives est devenue élevée.
  • Des entreprises comme Sports Illustrated semblent davantage intéressées par l’amélioration de leur position dans les résultats de recherche Google et par les revenus publicitaires que par le service rendu à leurs lecteurs.

L’avis de GN⁺

  • La qualité des informations sur Internet ne cesse de se dégrader, ce qui provoque confusion et inconfort chez les utilisateurs.
  • L’un des effets secondaires des progrès de l’IA est qu’il devient plus difficile de trouver des informations fiables à cause des fausses informations qu’elle génère.
  • Ces évolutions poussent les utilisateurs à repenser leur manière d’obtenir des informations sur Internet et suggèrent qu’une nouvelle approche est nécessaire pour garantir la qualité de l’information.

1 commentaires

 
GN⁺ 2024-01-12
Avis Hacker News
  • L’un des problèmes apparus avec la diffusion des grands modèles de langage (Large Language Models, LLMs) est qu’auparavant, il existait une heuristique utile permettant d’écarter rapidement les publications sans valeur grâce aux fautes d’orthographe ou de grammaire, mais que cette méthode ne fonctionne plus, car les contenus générés par l’IA maîtrisent parfaitement la langue. Par exemple, le projet curl a rencontré des problèmes à cause de faux rapports de bugs générés par l’IA. On s’attend à ce que ce problème s’aggrave encore à l’avenir.

  • Tout en étant d’accord sur l’évolution d’Internet, certains estiment qu’Internet n’est pas très différent d’avant GPT-4, 3 ou 2. Les articles sur des sujets génériques rédigés par des stagiaires ou des assistants virtuels en Inde sont pour la plupart aussi mauvais que les contenus générés par l’IA, et il est difficile de les distinguer. Le fait que les moteurs de recherche classent les pages davantage selon leur réputation que selon la correspondance entre le texte de la page et la requête est aussi problématique. Les gens vivent désormais davantage dans les apps que sur le web, et la qualité du web se dégrade depuis longtemps, au point qu’elle pourrait bientôt ne plus vraiment compter. Si Internet continue d’exister à l’avenir, certains espèrent qu’il évoluera vers une nouvelle couche anonymisée, où des échanges monétaires seraient plus souvent requis afin de réduire la production de contenus de mauvaise qualité.

  • Vu la gravité de la situation actuelle sur le clearnet, certains trouvent que le fait que l’information soit cloisonnée à l’intérieur de Discord n’est pas forcément une mauvaise chose. Le fait de ne pas être indexé par les moteurs de recherche permet d’éviter d’apparaître aux côtés des déchets générés par l’IA ou d’être utilisé comme données d’entraînement. L’avenir d’Internet dépend des humains, et il n’est désormais plus possible de faire confiance aux machines, même pour des tâches élémentaires.

  • Un témoignage partage l’expérience du projet BeamMP avec de faux rapports de bugs et des PRs (pull requests) générés par l’IA. Ces productions d’IA sont faciles à identifier, avec des caractéristiques comme la modification de code sans rapport ou la proposition de solutions qui ne compilent pas. Les vraies personnes sont paresseuses, donc elles ne font pas de travail inutile ; comme ces déchets générés par l’IA sont une perte de temps, ils ne sont pas fusionnés.

  • Il est important de préserver l’authenticité sur Internet. Seul le contenu signé peut garantir cette authenticité. Dans un contexte où l’IA peut publier toujours plus, le seul moyen de filtrer est de s’appuyer sur la confiance et l’authenticité, en sachant qui publie quoi et ce qu’il dit. Le Web of Trust a déjà été tenté sans jamais devenir grand public, mais il est peut-être temps de réessayer.

  • Certains y voient un vieux problème accéléré par les LLMs. À mesure que Google a cherché à accroître ses revenus publicitaires et sa domination dans l’ad tech, le SEO est devenu omniprésent dans les résultats de recherche, rendant plus difficile l’accès à une information objective. Chercher d’abord l’information sur Reddit peut être une solution, mais Reddit lui aussi s’est rempli ces dernières années de contenus manipulés.

  • D’autres estiment que, comme Internet était déjà plein de déchets produits par des humains à cause du SEO, l’arrivée de « l’IA » n’a pas réellement fait perdre grand-chose. Certaines personnes dénoncent ce problème dans l’industrie depuis longtemps déjà.

  • La publicité vise au final à gagner de l’argent, et à moins que les bots n’aient des cartes bancaires, cela signifie de l’argent venant d’êtres humains. Des entreprises comme Google ressentiront financièrement l’impact si l’augmentation du trafic ne se transforme pas en dépenses humaines. Les licenciements massifs récents dans la tech peuvent laisser penser que la réponse à ce problème commence déjà.

  • Si vous avez lu le livre « Anathem », alors notre mission est de filtrer les déchets du Reticulum.