-
Soupçons de torrenting illégal chez Meta
- Des e-mails récemment rendus publics sont présentés comme des preuves clés dans le procès en droit d’auteur accusant Meta d’avoir entraîné illégalement ses modèles d’IA sur des livres piratés.
- Meta a reconnu avoir téléchargé en torrent LibGen, un dataset controversé contenant des dizaines de millions de livres piratés.
- Meta a téléchargé en torrent au moins 81,7 téraoctets de données provenant de plusieurs bibliothèques fantômes via Anna’s Archive, dont 35,7 téraoctets issus de Z-Library et de LibGen.
- Les auteurs affirment que les actes de piratage de données illégaux de Meta sont d’une gravité extrême et soulignent que même un volume limité d’atteintes au droit d’auteur peut conduire à une enquête pénale.
-
Les auteurs élargissent leur théorie sur la diffusion
- Bien que leurs demandes d’informations sur le torrenting et le seeding de Meta aient été rejetées, les auteurs ont rassemblé eux-mêmes des preuves.
- Nikolay Bashlykov, ingénieur de recherche chez Meta, a exprimé ses inquiétudes en déclarant que « faire du torrenting depuis un ordinateur portable d’entreprise n’est pas approprié ».
- Bashlykov a consulté directement l’équipe juridique, en soulignant que l’usage de torrents pouvait être illégal.
-
Soupçons de dissimulation du seeding chez Meta
- Des messages internes rendus publics indiquent que Meta aurait tenté de dissimuler le seeding en téléchargeant les données sans utiliser les serveurs de Facebook.
- Michael Clark, responsable de la gestion du projet, a mentionné des changements de configuration visant à minimiser le seeding.
- Les auteurs affirment que ces nouvelles informations contredisent des témoignages antérieurs et demandent un nouvel interrogatoire des personnes concernées.
- Mark Zuckerberg a affirmé ne pas avoir participé à la décision d’utiliser LibGen, mais des e-mails suggèrent qu’il était impliqué.
-
Réponse juridique de Meta
- Meta soutient devant la justice que l’entraînement de l’IA relève de l’usage loyal et affirme que les livres des auteurs n’ont pas été effectivement distribués.
- Meta se prépare à une riposte juridique face aux accusations de violation du droit d’auteur.
1 commentaires
Commentaires sur Hacker News
YouTube, Google et Spotify se sont tous développés au départ en enfreignant le droit d’auteur. Les entreprises protègent leur propre propriété intellectuelle tout en violant facilement les droits d’autrui. Les particuliers n’ont pas ce privilège, et ceux qui essaient de respecter la loi finissent par être pénalisés
Il est recommandé de lire le discours de Thomas Babington Macaulay sur le droit d’auteur. Les prolongations du droit d’auteur profitent souvent uniquement aux éditeurs
Il est évident que Meta a entraîné ses LLM sur des contenus protégés par le droit d’auteur. Ils l’admettent également dans leurs articles. Il faut débattre de la question de savoir s’il est légal d’entraîner des modèles d’IA sur des contenus protégés par le droit d’auteur
Libgen doit être soutenu comme un projet civilisationnel de l’humanité, et ne doit pas être puni. À l’avenir, nous réaliserons à quel point nous étions stupides
Beaucoup critiquent les grandes entreprises, surtout Meta, et demandent des sanctions, mais il serait plus judicieux de réformer le droit de la propriété intellectuelle
Par le passé, les internautes estimaient que le droit d’auteur était trop strict, affirmant qu’il limitait le savoir de l’humanité au profit d’une minorité
Je n’ai jamais utilisé Meta AI, et je n’ai vu personne autour de moi l’utiliser non plus. Il est difficile de comprendre quel est le ROI de Meta
Un article affirme que des employés de Meta ont menti au sujet du téléchargement et de la diffusion illégaux de contenus protégés par le droit d’auteur
Quand une grande entreprise « télécharge une voiture », cela passe, mais quand un particulier le fait, cela devient un problème