Sommes-nous tous devenus des plagiaires ?
(economist.com)- À l’ère de l’IA, alors que les critères du vol de propriété intellectuelle deviennent flous, le débat s’intensifie autour de la définition du plagiat et de ce qui peut être toléré
- Le plagiat se répète depuis longtemps dans l’histoire de la littérature, de la musique et des discours, et même des œuvres célèbres ont parfois été acceptées sans difficulté
- En raison de l’absence de définition claire, le plagiat est interprété très largement, de la copie littérale à l’emprunt d’idées, tandis que les progrès techniques facilitent à la fois la détection et la reproduction
- La frontière entre création et originalité est floue depuis longtemps, et des géants de la littérature comme Chaucer, Shakespeare ou Swift ont eux aussi été accusés de plagiat
- Anthropic a accepté de verser 1,5 milliard de dollars à des auteurs pour l’utilisation de 7 millions de livres piratés
- La créativité et l’originalité ont toujours été en tension avec l’imitation, et l’IA étend aujourd’hui cette vieille question à l’ensemble de la société comme aux individus
La mansuétude face au plagiat dans les grandes œuvres littéraires
- Il existe un cas où une partie de Pride and Prejudice de Jane Austen, légèrement modifiée puis soumise comme œuvre nouvelle, n’a pas été reconnue par de nombreux éditeurs
- Cet exemple montre que même la reconnaissance d’une phrase célèbre varie selon le contexte et les attentes du lecteur
Histoire du plagiat et signification contemporaine
- Le nouveau livre de Roger Kreuz traite de divers cas de plagiat au XXe siècle dans la musique (Bob Dylan), la littérature (Dylan Thomas) et les discours (Joe Biden), entre autres
- Dans le discours de réception du prix Nobel de littérature de Bob Dylan, qui évoquait Moby Dick, des formulations proches de SparkNotes ont été relevées
- Le mot plagiat lui-même viendrait d’un poème du poète romain Martial, et le latin plagiarius signifie « kidnappeur »
- Selon le droit romain, le plagiaire était défini comme un criminel qui devait être « jeté aux bêtes sauvages lors de la première cérémonie publique »
Le débat sur le plagiat relancé à l’ère de l’IA
- Bien que la notion de plagiat soit ancienne, l’entraînement et la génération par l’IA lui redonnent une importance nouvelle sur les plans personnel et juridique
- la question éthique de faire rédiger par l’IA une lettre de motivation ou une lettre d’amour
- la question de la responsabilité juridique des entreprises d’IA qui entraînent leurs modèles sur des œuvres protégées par le droit d’auteur
- La frontière entre vol intellectuel et inspiration devient encore plus floue avec l’IA
Un plagiat difficile à définir et l’impact de la technologie
- Le plagiat couvre un spectre large, de la copie mot à mot à l’emprunt d’idées
- Les technologies numériques facilitent la reproduction, tout en renforçant en même temps la détection
- Contrairement à l’époque des copies manuscrites et de l’imprimerie au plomb, la chute drastique du coût de la copie a accru la fréquence du plagiat
Une nouvelle phase du plagiat avec l’IA
- Comme des LLM tels que ChatGPT ou Claude sont entraînés sur de vastes quantités d’œuvres protégées, certains les accusent de détourner le travail des créateurs
- Dans une procédure, les plaignants ont affirmé que les entreprises d’IA se livraient à un « détournement organisé à grande échelle »
- Le 15 janvier 2026, deux maisons d’édition ont demandé à participer à une action collective contre GoogleAI, évoquant « la violation du droit d’auteur la plus vaste de l’histoire »
- Anthropic a conclu un accord prévoyant le versement de 1,5 milliard de dollars pour avoir utilisé 7 millions de livres piratés dans l’entraînement
- Kreuz soutient que l’usage de ChatGPT ne constitue pas un plagiat, puisqu’il ne copie pas à partir d’une source unique
- Il a comparé les LLM à un « nègre littéraire » non crédité, mais beaucoup y voient plutôt un « plagiat avec un complice IA »
- D’un point de vue critique, il s’agit d’un double délit : l’IA vole les mots des données d’entraînement, puis l’utilisateur s’approprie ces mots pour en tirer profit
L’ancienne frontière entre création et plagiat
- Des géants de la littérature comme Chaucer, Shakespeare et Swift ont été accusés de plagiat, au point que cela ressemble à un véritable « who’s who du monde littéraire »
- Shakespeare a emprunté à Plutarque la scène de la barge dans Antony and Cleopatra, mais il devait alors recopier le texte à la main
- Produire des imitations de Dickens comme Martin Guzzlewit ou Oliver Twiss exigeait encore du temps et un travail de composition typographique
- Depuis l’apparition de la touche Ctrl+C, le plagiat est devenu plus facile et plus difficile à contrôler
- Il y a 250 ans, Laurence Sterne dénonçait les plagiaires en les comparant à des apothicaires, mais on a découvert que cette formule elle-même venait de Robert Burton
- Mark Twain affirmait qu’« il n’y a presque rien d’autre que du plagiat dans la parole humaine »
Distinguer inspiration et plagiat
- La phrase célèbre de T.S. Eliot : « Les poètes immatures imitent, les poètes mûrs volent »
- mais la suite est moins connue : « les mauvais poètes défigurent ce qu’ils prennent, et les bons en font quelque chose de meilleur ou du moins de différent »
- Dans l’affaire Anthropic, le juge a comparé l’entreprise à un « lecteur qui aspire à devenir écrivain », estimant qu’elle produisait des œuvres nouvelles
La naissance du droit d’auteur et l’impact de la technologie
- Avec la mise en place du droit d’auteur au XVIIIe siècle, les droits de reproduction ont été clarifiés et les violations sont devenues plus nettement poursuivables
- Robert Douglas-Fairhurst, professeur de littérature anglaise à Oxford : « L’écriture est un métier, il faut donc protéger son bien »
- Charles Dickens a poursuivi les imprimeurs qui reproduisaient ses œuvres, à la fois par colère liée au droit d’auteur et pour des raisons financières
Les progrès des technologies de détection de l’IA
- Les universités utilisent de plus en plus l’IA pour détecter les devoirs rédigés par l’IA
- Les étudiants recourent à des services comme Dumb it Down pour rendre les textes générés par l’IA plus naturels
- Selon Chris Caren, CEO de Turnitin, les textes plagiés sont comme du « beige » : bien écrits, mais sans dynamisme
- Parmi les traits linguistiques des textes générés par l’IA, on trouve des mots fades comme « holistic » et l’usage fréquent de « notably »
Un problème qui concerne tout le monde
- Dans le New York Times, les mentions du plagiat sont huit fois plus fréquentes que dans les années 1950
- Les cas de plagiat ont peut-être augmenté, mais ils attirent aussi l’attention du public parce qu’ils suivent une structure narrative tragique parfaite : la chute d’un héros imparfait
- À l’ère de l’IA, le débat sur le plagiat dépasse les auteurs pour devenir une question de société
Enseignements à retenir
- L’article, dans son ensemble, dépeint avec ironie une époque où le plagiat devient un comportement universel plutôt qu’une exception
- Le sous-titre « steal industry is booming » exprime de façon critique le fait que le détournement est devenu un phénomène culturel quotidien
- Il suggère que non seulement la littérature, mais aussi l’ensemble de la culture voit l’authenticité de la création et l’originalité mises à l’épreuve
- La question « Sommes-nous tous devenus des plagiaires ? » pose la nécessité de redéfinir l’éthique et la valeur de la création
1 commentaires
Avis sur Hacker News
Mon avis est simple
Réutiliser mot pour mot de longues phrases ou des mots sans citer la source, ce n’est pas acceptable
Réinterpréter une histoire existante avec d’autres mots, c’est acceptable
Copier un dessin presque à l’identique avec l’intention de tromper, ce n’est pas acceptable
En revanche, imiter un style ou un contenu peut être acceptable si l’approche est différente
Les gens sont trop obsédés par la nouveauté. Si quelqu’un s’inspire de mon œuvre pour la recomposer ou la réexprimer, je trouve ça formidable
Par exemple, Star Wars suit très fidèlement la structure classique du voyage du héros, mais conserve malgré tout sa valeur. La plupart des œuvres de fantasy modernes ressemblent aussi à des fanfictions de Middle Earth, mais elles ont tout de même leur raison d’être
Ce n’est pas parce que quelqu’un aurait produit des notes au hasard toute sa vie qu’il pourrait posséder toute la musique créée pendant les décennies suivantes
Un usage non transformateur pose problème, mais un usage transformateur est acceptable
Il ne faut pas avoir l’intention de tromper sur la source, mais simplement imiter un style est acceptable
La plupart des grandes histoires suivent cette structure dans une certaine mesure, mais c’est leur mise en œuvre propre qui les rend spéciales
C’est un peu comme dire « une webapp qui copie React à l’identique », alors qu’en pratique, c’est quelque chose de complètement différent
De plus en plus d’universités cherchent à détecter les textes rédigés par l’IA
Mais un rapport de recherche indique que la précision de la détection IA de Turnitin est d’environ 90 %
Il est donc difficile de considérer cette détection comme parfaite
Certaines personnes peuvent avoir un style d’écriture proche de celui de l’IA, et l’IA peut aussi écrire comme un humain
Même si l’IA n’a aidé que pour quelques phrases, tout le texte peut être classé comme généré par l’IA
Au final, la frontière entre humain et IA devient floue
Il devient donc difficile de les distinguer des textes écrits par l’IA, et l’écriture perd sa fonction de preuve d’apprentissage
Les exposés oraux ou les discussions sont peut-être désormais le seul vrai moyen de prouver l’apprentissage
Si la probabilité est élevée, je vérifie les citations, et si le doute persiste, je convoque l’étudiant pour lui poser directement des questions
Au final, le jugement humain reste indispensable
Il est donc réglé pour réduire les faux négatifs plutôt que les faux positifs
On pourrait l’ajuster autrement si l’on voulait un détecteur plus équilibré
En réalité, il s’agit d’une sensibilité de 90 % et d’une spécificité de 100 %
Autrement dit, sur 100 fraudeurs utilisant l’IA, 10 ne seront pas repérés, mais un texte humain ne sera pas classé à tort
Voir une œuvre réalisée avec effort être recyclée à l’infini par des machines, répétée sans mention de source, laisse un goût amer
C’est dans la nature humaine d’appeler cela sa propre création et d’en être fier
La propriété intellectuelle (IP) ressemble davantage à un mécanisme de motivation psychologique qu’à un principe moral
Dans un monde idéal, la recherche se ferait par pure curiosité plutôt que pour un gain personnel, mais le réel n’est pas ainsi
Un salarié est rémunéré pour son travail, tandis que le résultat appartient à l’entreprise
Un indépendant, lui, possède le résultat, mais ne perçoit aucun salaire pour le travail en lui-même
Si l’on a publié quelque chose dans un esprit de partage, on a en fait distribué gratuitement son propre capital
Si l’on veut une contrepartie, il faut le monétiser ou être rémunéré par la marque et la réputation
Il est ironique que l’arrivée de l’IA ait au contraire poussé davantage de gens à défendre le droit d’auteur
Affaiblir les droits des créateurs renforce le pouvoir des distributeurs
Cela produit une structure dans laquelle la majeure partie des gains économiques revient aux intermédiaires de la distribution
Des systèmes comme celui de l’Allemagne, où la cession du droit d’auteur n’est pas possible, aident à l’empêcher
Comme dans l’industrie pétrolière, cette structure qui absorbe la richesse à l’étape intermédiaire s’est diffusée dans toute la société
La frénésie autour de l’IA ressemble elle aussi, au fond, à une prolongation de cette avidité du type « comment récupérer ma part »
Les créateurs ont une capacité de production finie, alors que les distributeurs peuvent accumuler les droits à l’infini
La notion de plagiat n’est pas la même dans le roman et dans la recherche académique
Dans le roman, emprunter des idées peut être acceptable, mais dans le monde académique, l’idée elle-même est l’actif central, donc mentionner la source est indispensable
Se contenter de reformuler des phrases est la forme la plus habile de plagiat
Un bon article scientifique est rempli de citations et de références, auxquelles il ajoute ensuite un éclairage nouveau
Reprendre une phrase telle quelle sans citation, c’est du plagiat, tandis que paraphrase + citation est acceptable
Cela dit, la frontière du « savoir commun » (common knowledge) reste floue et crée parfois de la confusion
La véritable tragédie de l’ère de l’IA est que les gens ont fini par accepter sans esprit critique la notion de droit d’auteur
Je recommande RiP!: A Remix Manifesto et cette vidéo YouTube
L’œuvre a 20 ans, mais les humains restent au fond des machines à remix
Je pense que les LLM sont le premier cas de mise en œuvre technique d’une partie de la créativité humaine
Ils n’ont pas d’émotions, mais les humains leur apportent la qualité et l’émotion en tant que filtre final
Si les ingénieurs ont du mal à comprendre la propriété intellectuelle (IP), c’est parce que ce droit repose sur l’intention
Le fait que les tribunaux infèrent l’intention pour rendre leur jugement ne correspond pas à la manière de penser des ingénieurs
Le « récit du plagiat » est captivant, comme une tragédie héroïque
Mais les « entreprises tech » n’ont longtemps pas produit directement de contenu, elles ne faisaient qu’en intermédier l’accès
Désormais, avec l’IA générative, elles produisent directement du contenu
La question est alors de savoir si, dans ce processus, elles ont utilisé sans autorisation de vastes ensembles de matériaux protégés par le droit d’auteur ; ce sera aux tribunaux d’en juger
Au final, ces entreprises intermédiaires continuent malgré tout à collecter des données, à surveiller, puis à utiliser librement ces informations
À l’ère de l’IA, la frontière entre plagiat et inspiration est floue
Il y a débat pour savoir si utiliser ChatGPT relève du plagiat ou d’une collaboration avec un « coauteur IA »
Même les voix IA utilisées pour la lecture d’articles posent une question semblable : si elles ont appris les caractéristiques vocales de personnes réelles, le problème n’est pas si différent de celui du droit d’auteur
On pose la question suivante : « Si personne n’avait jamais écrit de science-fiction, l’IA pourrait-elle vraiment écrire de la science-fiction ? »
On trouve déjà des éléments imaginaires dans L’Épopée de Gilgamesh ou le Ramayana
Le genre est trop vaste pour être une notion appropriable
L’inspiration n’est pas du plagiat
Il lui serait difficile de produire de la science-fiction sans aucune base préalable