PhysicsForums et la théorie de l’Internet mort
(hallofdreams.org)L’avenir d’Internet
- PhysicsForums est un forum scientifique fondé en 2001, principalement axé sur la fourniture d’indices aux étudiants pour leurs devoirs de physique.
- Le site a connu une croissance régulière jusqu’en 2012, avant de décliner ensuite face à des sites centralisés comme StackExchange.
- Jusqu’en 2025, en ne changeant pas ses URL et sans supprimer ses publications, il joue le rôle d’une capsule temporelle offrant un aperçu de l’Internet d’autrefois.
L’histoire de Ravenprp
- Ravenprp est un utilisateur qui a publié 2 891 messages en l’espace de 7 mois entre 2006 et 2007, décrit comme quelqu’un possédant des connaissances dans des domaines variés.
- En réalité, il n’a rédigé que 74 messages, et les autres semblent avoir été ajoutés plus tard.
Internet est éternel
- PhysicsForums a fusionné avec MathHelpBoards et intégré 150 000 messages, un processus au cours duquel la base de données a été modifiée.
- En 2023 et 2024, 115 000 messages rédigés par des LLM (grands modèles de langage) ont été ajoutés.
La théorie de l’Internet mort
- La « théorie de l’Internet mort » soutient qu’une grande partie d’Internet est constituée d’entités non humaines.
- Avec l’arrivée des LLM, une part croissante du contenu en ligne est générée par des machines plutôt que par des contributions humaines.
Humains contre machines
- La communauté de PhysicsForums a exprimé ses inquiétudes au sujet des contenus générés par l’IA, comme ceux de ChatGPT.
- L’expérience s’est soldée par un échec, car le contenu généré par l’IA ne répondait pas aux critères de qualité du site.
Internet, ce sont des personnes
- Greg Bernhardt prévoit d’améliorer ou de supprimer les fonctionnalités d’IA en s’appuyant sur les retours de la communauté.
- Ajouter du contenu généré par des LLM à des comptes utilisateurs existants dilue l’identité des utilisateurs et déforme les archives historiques d’Internet.
Cet article traite des transformations de PhysicsForums et de l’évolution d’Internet, tout en explorant l’impact de l’IA sur les contenus en ligne.
1 commentaires
Avis Hacker News
Rejet croissant des contenus générés par les LLM : beaucoup de gens ne veulent pas de contenu généré par l’IA. Sur les blogs ou les forums, ils veulent lire des textes écrits par des humains. Ils dépensent beaucoup de temps et d’énergie pour éviter le contenu généré par l’IA. S’il existait dans Google un filtre « supprimer le contenu généré », ils voudraient l’utiliser. Des recherches montrent que lorsqu’on reconnaît un contenu généré par l’IA, on a tendance à le rejeter immédiatement. Cela pousse les éditeurs à pratiquer un « blanchiment humain » pour faire passer du contenu écrit par l’IA pour du contenu rédigé par des humains.
Déclin des forums et blogs traditionnels : depuis 2012, la croissance des forums et blogs traditionnels a ralenti. Google a commencé à déclasser les sites qui ne sont pas des acteurs majeurs, quelle que soit leur qualité. Cependant, certains forums conservent leurs anciennes publications, ne changent pas d’URL et restent en ligne dans la durée.
L’évolution de PhysicsForums : PhysicsForums était autrefois un site très utilisé, mais sa fréquentation a baissé avec la montée des réseaux sociaux. Les archives restent utiles, et ce n’est pas parce qu’un lien n’est pas partagé sur Twitter que personne ne s’y intéresse.
Différence entre forums et sites centralisés : les Américains et les Européens apprécient divers forums de niche, tandis que les Chinois préfèrent les sites centralisés. Zhihu était au départ un clone de Quora, mais c’est aujourd’hui le plus grand site de discussions approfondies sur des sujets variés. À l’inverse, la qualité de Quora s’est dégradée avec le temps.
Le problème des commentaires générés par l’IA : le propriétaire du site a reconnu avoir ajouté des commentaires IA antidatés. Il existe une théorie de « l’économie morte » dans laquelle l’IA envoie des CV, les lit puis les rejette. L’interaction humaine est importante, et le contenu généré par l’IA y fait obstacle.
Le contrat social des communautés en ligne : quand on crée un compte dans une communauté en ligne, on s’attend généralement à interagir avec des personnes. Mais interagir avec des utilisateurs générés par l’IA fait perdre la valeur de l’interaction humaine.
Les difficultés de gestion d’un forum : quand les utilisateurs ne sont pas actifs sur un forum ou un blog, l’exploitant finit par créer lui-même des sujets et rédiger des réponses. Cela entraîne parfois des problèmes comparables à de la publicité spam.
Problèmes de confiance et d’attribution : sur le Web, les problèmes de confiance et d’attribution ont toujours existé, mais ils sont aujourd’hui plus graves. Il faut des solutions.
Vie privée et questions juridiques : certains estiment qu’il faut déposer une marque pour protéger son nom ou son pseudonyme. L’idée d’utiliser une PKI pour signer et vérifier les publications est aussi envisagée.