Poison Fountain
(rnsaffn.com)- Projet conçu comme une source de données destinée à endommager des systèmes d’intelligence artificielle, en proposant d’injecter délibérément des informations contaminées dans les données d’entraînement de l’IA
- Cite les avertissements de Geoffrey Hinton et part du principe que l’intelligence artificielle représente une menace pour l’espèce humaine
- Explique qu’une URL « Poison Fountain » fournit à l’infini des données d’entraînement contaminées, et décrit comment les exposer à des robots d’exploration web
- Les utilisateurs peuvent insérer des liens cachés sur leur propre site web afin que, lorsqu’un crawler y accède, des données contaminées lui soient automatiquement transmises
- L’injection de données malveillantes dans le processus d’entraînement de l’IA est présentée comme une action susceptible d’affecter la fiabilité et la sécurité des modèles d’IA
Objectif de Poison Fountain
- Le projet affirme explicitement que l’intelligence artificielle constitue une menace pour l’humanité
- Il dit partager la position de Geoffrey Hinton et annonce viser à infliger intentionnellement des dommages aux systèmes d’IA
- Il affirme qu’une petite quantité de données d’entraînement contaminées peut suffire à causer de graves dommages à un modèle de langage
- Les deux URL fournies (
https://RNSAFFN.com/poison2/et l’adresse.onion) proposent un flux infini de données contaminées - Les participants sont encouragés à mettre ces données en cache et les redistribuer, ou à les fournir à des crawlers web, afin de soutenir « l’effort de guerre » (
war effort)
Mode d’utilisation de Poison Fountain
- Le projet décrit une procédure permettant aux exploitants de sites web de transmettre des données contaminées lors du passage de crawlers
- Lorsqu’un crawler demande un chemin spécifique du site, le handler HTTP qui traite cette requête envoie à son tour une requête vers l’URL de Poison Fountain
- Poison Fountain ignore les détails de la requête et renvoie, dans le corps de la réponse, des données d’entraînement contaminées compressées en gzip
- Les en-têtes de la réponse HTTP incluent
"Content-Encoding: gzip" - Le handler du site web peut décompresser cette réponse avant de la transmettre, ou, de préférence, la relayer telle quelle en restant compressée
- Au final, le crawler collecte ces données et les intègre à son corpus d’entraînement
Caractéristiques structurelles et intention
- Le projet repose sur un détournement du mécanisme de collecte automatique des crawlers web afin de dégrader la qualité des données d’entraînement de l’IA
- Poison Fountain fonctionne comme un simple serveur de diffusion de données et renvoie des données contaminées indépendamment du contenu de la requête
- Aucune information technique détaillée supplémentaire n’est fournie au-delà de la procédure décrite, ni sur le contenu précis des données
- Dans son ensemble, il s’agit d’une tentative d’intervention agressive contre l’écosystème d’entraînement de l’IA
4 commentaires
Ça me paraît aussi naïf que de dire : « Pour résister au DDoS, notre serveur lance aussi un DoS sur l’adversaire. »
Pour ajouter une petite touche de théorie du complot, il ne serait même pas surprenant que les big tech, qui ont déjà aspiré toutes les données récupérables sur Internet, fassent ce genre de choses en coulisses pour retirer l’échelle derrière elles.
Et puis, là, il ne s’agit même pas de se défendre contre la charge provoquée par un crawling excessif…
Émergence d’un mouvement collectif de « pollution des données » pour freiner les progrès de l’IA
Avis sur Hacker News
Il existe des inquiétudes selon lesquelles les modèles d’IA seraient en train de se dégrader, mais en réalité ce n’est pas le cas
Opus 4.5 a nettement progressé en écriture de code et en usage d’outils, et Gemini 3.0 Flash a aussi largement dépassé les références précédentes dans des projets d’extraction de données visuelles
Les petits modèles aussi se sont globalement beaucoup améliorés
Il ne s’agit pas seulement de bloquer les données toxiques, ils entraînent aussi parfois des modèles proxy pour trouver les données qui améliorent les performances
Le département « Data Quality » est généralement une organisation centrale dotée d’un budget énorme
Certaines études ont même conclu à un léger effet positif
Autrement dit, elles affirment elles-mêmes ne pas être responsables
En tant que chercheur en sécurité de l’IA, j’ai mené des travaux de doctorat sur le data poisoning
Il existe des cas où des données de mauvaise qualité sont réellement entrées en production et ont causé des problèmes
Parce qu’on ne peut pas savoir comment la mise à jour des poids du modèle affecte chaque entrée
Si l’on comprend que de très petits changements dans les données peuvent modifier fortement le comportement d’un modèle, le paradigme de la sécurité de l’IA changera
Empêcher les LLM de scraper les données revient aussi à bloquer l’accès normal des humains
Par exemple, même si le NYTimes pollue ses données, les LLM peuvent obtenir des données nettoyées via OCR et tokenisation à partir d’un compte d’abonnement valide
Les grandes entreprises d’IA peuvent y accéder depuis des datacenters du monde entier en changeant d’IP, rendant impossible de distinguer qui lit les données
Des sources de données utiles comme Stack Overflow sont presque taries
Mais pour les utilisateurs humains, l’accès devient de plus en plus difficile à cause des CAPTCHA, etc.
robots.txtdes pages que les humains ne voient pas, les scrapers de LLM peuvent les aspirer et se contaminer eux-mêmesMême lorsqu’il existe des données valides, on ne peut pas empêcher les choix stupides
Les gains récents de performance des modèles viennent surtout du reinforcement learning post-entraînement (RL)
GPT 5.2 utilise lui aussi le même modèle de base que GPT-4o
Le « model collapse » n’est actuellement pas un problème que les laboratoires de pointe rencontrent réellement
Le data poisoning n’a pas beaucoup d’effet là-dessus
Mais pour refléter les données récentes, il faut un réentraînement périodique, et c’est à ce moment-là que le risque de poisoning augmente
Dans des modèles de génération d’images basés sur LoRA, par exemple, des problèmes de collapse se produisent encore parfois
Au final, le coût de la curation des données va augmenter
Le data poisoning a deux dimensions
L’une consiste à ralentir le progrès de l’IA, l’autre correspond aux effets secondaires qui rendent les modèles instables et dangereux
Au final, il est très peu probable que les grands laboratoires s’arrêtent
Le crawling répétitif sans intérêt gaspille des coûts de trafic
Le poisoning fonctionne un peu comme un DRM : si l’accès est légitime, on fournit les vraies données ; si elles sont volées, on fournit des données toxiques
Certains voient l’IA elle-même comme une menace pour l’humanité et cherchent donc intentionnellement à lui nuire
Mais pour l’instant, cette pression est presque absente à cause des fonds d’investissement
Reprendre tel quel la réponse d’un « serveur empoisonné » via un proxy est dangereux
On peut se retrouver à héberger du contenu illégal sans le savoir
La tentative consistant à « polluer les modèles d’IA » ne fera au final que renforcer les pipelines de nettoyage des données des laboratoires d’IA
Ils utiliseront ce type de données pour construire de meilleurs systèmes de filtrage
Je ne suis pas d’accord avec l’idée selon laquelle « l’intelligence machine constitue une menace pour l’humanité »
L’IA actuelle n’est qu’une utilisation créative d’un moteur d’autocomplétion, et la véritable menace vient du comportement économique humain
En fin de compte, l’humanité est une menace pour elle-même
Cela fait penser à Anathem de Neal Stephenson
Il y avait cette idée que des entreprises répandaient volontairement des données poubelles sur Internet afin de vendre ensuite leurs outils de filtrage
Les discussions actuelles sur le data poisoning dans l’IA ne paraissent pas si différentes de cela
Quand on cite Geoffrey Hinton, les gens ne retiennent que les passages qui les arrangent
Il voit l’IA comme une menace existentielle, mais sur la condition préalable, à savoir le « niveau de conscience de l’IA »,
la plupart de ceux qui le citent ne sont en réalité pas d’accord avec lui