6 points par GN⁺ 2026-01-29 | 1 commentaires | Partager sur WhatsApp
  • À l’ère de l’IA, alors que les critères du vol de propriété intellectuelle deviennent flous, le débat s’intensifie autour de la définition du plagiat et de ce qui peut être toléré
  • Le plagiat se répète depuis longtemps dans l’histoire de la littérature, de la musique et des discours, et même des œuvres célèbres ont parfois été acceptées sans difficulté
  • En raison de l’absence de définition claire, le plagiat est interprété très largement, de la copie littérale à l’emprunt d’idées, tandis que les progrès techniques facilitent à la fois la détection et la reproduction
  • La frontière entre création et originalité est floue depuis longtemps, et des géants de la littérature comme Chaucer, Shakespeare ou Swift ont eux aussi été accusés de plagiat
  • Anthropic a accepté de verser 1,5 milliard de dollars à des auteurs pour l’utilisation de 7 millions de livres piratés
  • La créativité et l’originalité ont toujours été en tension avec l’imitation, et l’IA étend aujourd’hui cette vieille question à l’ensemble de la société comme aux individus

La mansuétude face au plagiat dans les grandes œuvres littéraires

Histoire du plagiat et signification contemporaine

  • Le nouveau livre de Roger Kreuz traite de divers cas de plagiat au XXe siècle dans la musique (Bob Dylan), la littérature (Dylan Thomas) et les discours (Joe Biden), entre autres
  • Dans le discours de réception du prix Nobel de littérature de Bob Dylan, qui évoquait Moby Dick, des formulations proches de SparkNotes ont été relevées
  • Le mot plagiat lui-même viendrait d’un poème du poète romain Martial, et le latin plagiarius signifie « kidnappeur »
  • Selon le droit romain, le plagiaire était défini comme un criminel qui devait être « jeté aux bêtes sauvages lors de la première cérémonie publique »

Le débat sur le plagiat relancé à l’ère de l’IA

  • Bien que la notion de plagiat soit ancienne, l’entraînement et la génération par l’IA lui redonnent une importance nouvelle sur les plans personnel et juridique
    • la question éthique de faire rédiger par l’IA une lettre de motivation ou une lettre d’amour
    • la question de la responsabilité juridique des entreprises d’IA qui entraînent leurs modèles sur des œuvres protégées par le droit d’auteur
  • La frontière entre vol intellectuel et inspiration devient encore plus floue avec l’IA
Publicité

Un plagiat difficile à définir et l’impact de la technologie

  • Le plagiat couvre un spectre large, de la copie mot à mot à l’emprunt d’idées
  • Les technologies numériques facilitent la reproduction, tout en renforçant en même temps la détection
  • Contrairement à l’époque des copies manuscrites et de l’imprimerie au plomb, la chute drastique du coût de la copie a accru la fréquence du plagiat

Une nouvelle phase du plagiat avec l’IA

  • Comme des LLM tels que ChatGPT ou Claude sont entraînés sur de vastes quantités d’œuvres protégées, certains les accusent de détourner le travail des créateurs
  • Dans une procédure, les plaignants ont affirmé que les entreprises d’IA se livraient à un « détournement organisé à grande échelle »
  • Le 15 janvier 2026, deux maisons d’édition ont demandé à participer à une action collective contre GoogleAI, évoquant « la violation du droit d’auteur la plus vaste de l’histoire »
  • Anthropic a conclu un accord prévoyant le versement de 1,5 milliard de dollars pour avoir utilisé 7 millions de livres piratés dans l’entraînement
  • Kreuz soutient que l’usage de ChatGPT ne constitue pas un plagiat, puisqu’il ne copie pas à partir d’une source unique
  • Il a comparé les LLM à un « nègre littéraire » non crédité, mais beaucoup y voient plutôt un « plagiat avec un complice IA »
  • D’un point de vue critique, il s’agit d’un double délit : l’IA vole les mots des données d’entraînement, puis l’utilisateur s’approprie ces mots pour en tirer profit

L’ancienne frontière entre création et plagiat

  • Des géants de la littérature comme Chaucer, Shakespeare et Swift ont été accusés de plagiat, au point que cela ressemble à un véritable « who’s who du monde littéraire »
  • Shakespeare a emprunté à Plutarque la scène de la barge dans Antony and Cleopatra, mais il devait alors recopier le texte à la main
  • Produire des imitations de Dickens comme Martin Guzzlewit ou Oliver Twiss exigeait encore du temps et un travail de composition typographique
  • Depuis l’apparition de la touche Ctrl+C, le plagiat est devenu plus facile et plus difficile à contrôler
  • Il y a 250 ans, Laurence Sterne dénonçait les plagiaires en les comparant à des apothicaires, mais on a découvert que cette formule elle-même venait de Robert Burton
  • Mark Twain affirmait qu’« il n’y a presque rien d’autre que du plagiat dans la parole humaine »

Distinguer inspiration et plagiat

  • La phrase célèbre de T.S. Eliot : « Les poètes immatures imitent, les poètes mûrs volent »
    • mais la suite est moins connue : « les mauvais poètes défigurent ce qu’ils prennent, et les bons en font quelque chose de meilleur ou du moins de différent »
    Publicité
  • Dans l’affaire Anthropic, le juge a comparé l’entreprise à un « lecteur qui aspire à devenir écrivain », estimant qu’elle produisait des œuvres nouvelles

La naissance du droit d’auteur et l’impact de la technologie

  • Avec la mise en place du droit d’auteur au XVIIIe siècle, les droits de reproduction ont été clarifiés et les violations sont devenues plus nettement poursuivables
  • Robert Douglas-Fairhurst, professeur de littérature anglaise à Oxford : « L’écriture est un métier, il faut donc protéger son bien »
  • Charles Dickens a poursuivi les imprimeurs qui reproduisaient ses œuvres, à la fois par colère liée au droit d’auteur et pour des raisons financières

Les progrès des technologies de détection de l’IA

  • Les universités utilisent de plus en plus l’IA pour détecter les devoirs rédigés par l’IA
  • Les étudiants recourent à des services comme Dumb it Down pour rendre les textes générés par l’IA plus naturels
  • Selon Chris Caren, CEO de Turnitin, les textes plagiés sont comme du « beige » : bien écrits, mais sans dynamisme
  • Parmi les traits linguistiques des textes générés par l’IA, on trouve des mots fades comme « holistic » et l’usage fréquent de « notably »

Un problème qui concerne tout le monde

  • Dans le New York Times, les mentions du plagiat sont huit fois plus fréquentes que dans les années 1950
  • Les cas de plagiat ont peut-être augmenté, mais ils attirent aussi l’attention du public parce qu’ils suivent une structure narrative tragique parfaite : la chute d’un héros imparfait
  • À l’ère de l’IA, le débat sur le plagiat dépasse les auteurs pour devenir une question de société

Enseignements à retenir

  • L’article, dans son ensemble, dépeint avec ironie une époque où le plagiat devient un comportement universel plutôt qu’une exception
  • Le sous-titre « steal industry is booming » exprime de façon critique le fait que le détournement est devenu un phénomène culturel quotidien
  • Il suggère que non seulement la littérature, mais aussi l’ensemble de la culture voit l’authenticité de la création et l’originalité mises à l’épreuve
  • La question « Sommes-nous tous devenus des plagiaires ? » pose la nécessité de redéfinir l’éthique et la valeur de la création

1 commentaires

 
GN⁺ 2026-01-29
Avis sur Hacker News
  • Mon avis est simple
    Réutiliser mot pour mot de longues phrases ou des mots sans citer la source, ce n’est pas acceptable
    Réinterpréter une histoire existante avec d’autres mots, c’est acceptable
    Copier un dessin presque à l’identique avec l’intention de tromper, ce n’est pas acceptable
    En revanche, imiter un style ou un contenu peut être acceptable si l’approche est différente
    Les gens sont trop obsédés par la nouveauté. Si quelqu’un s’inspire de mon œuvre pour la recomposer ou la réexprimer, je trouve ça formidable
    Par exemple, Star Wars suit très fidèlement la structure classique du voyage du héros, mais conserve malgré tout sa valeur. La plupart des œuvres de fantasy modernes ressemblent aussi à des fanfictions de Middle Earth, mais elles ont tout de même leur raison d’être
    Ce n’est pas parce que quelqu’un aurait produit des notes au hasard toute sa vie qu’il pourrait posséder toute la musique créée pendant les décennies suivantes

    • Le droit adopte globalement la même position
      Un usage non transformateur pose problème, mais un usage transformateur est acceptable
      Il ne faut pas avoir l’intention de tromper sur la source, mais simplement imiter un style est acceptable
    • Le voyage du héros n’est pas une histoire réelle, mais un cadre narratif analysé dans le livre The Hero With a Thousand Faces
      La plupart des grandes histoires suivent cette structure dans une certaine mesure, mais c’est leur mise en œuvre propre qui les rend spéciales
      C’est un peu comme dire « une webapp qui copie React à l’identique », alors qu’en pratique, c’est quelque chose de complètement différent
    • L’école a tendance à trop insister sur l’« originalité absolue »
    • Comme le dit l’expression « Everything Is A Remix », une création totalement nouvelle relève presque du mythe. Comme l’histoire de Newton et de la pomme, c’est en partie une légende embellie
  • De plus en plus d’universités cherchent à détecter les textes rédigés par l’IA
    Mais un rapport de recherche indique que la précision de la détection IA de Turnitin est d’environ 90 %
    Il est donc difficile de considérer cette détection comme parfaite

    • J’ai essayé plusieurs outils, mais dans bien des cas, ce problème est fondamentalement insoluble
      Certaines personnes peuvent avoir un style d’écriture proche de celui de l’IA, et l’IA peut aussi écrire comme un humain
      Même si l’IA n’a aidé que pour quelques phrases, tout le texte peut être classé comme généré par l’IA
      Au final, la frontière entre humain et IA devient floue
    • En réalité, la plupart des textes d’étudiants sont eux-mêmes « plats et peu dynamiques »
      Il devient donc difficile de les distinguer des textes écrits par l’IA, et l’écriture perd sa fonction de preuve d’apprentissage
      Les exposés oraux ou les discussions sont peut-être désormais le seul vrai moyen de prouver l’apprentissage
    • J’insère les devoirs suspects dans Turnitin et dans plusieurs LLM pour comparer la probabilité de génération par IA
      Si la probabilité est élevée, je vérifie les citations, et si le doute persiste, je convoque l’étudiant pour lui poser directement des questions
      Au final, le jugement humain reste indispensable
    • Même avec 90 % de précision, le système est en pratique conçu avec un taux de détection de l’IA de 86 % et un taux de faux positifs sur des textes humains proche de 0 %
      Il est donc réglé pour réduire les faux négatifs plutôt que les faux positifs
      On pourrait l’ajuster autrement si l’on voulait un détecteur plus équilibré
    • L’expression « efficace à 90 % » est trompeuse
      En réalité, il s’agit d’une sensibilité de 90 % et d’une spécificité de 100 %
      Autrement dit, sur 100 fraudeurs utilisant l’IA, 10 ne seront pas repérés, mais un texte humain ne sera pas classé à tort
  • Voir une œuvre réalisée avec effort être recyclée à l’infini par des machines, répétée sans mention de source, laisse un goût amer

    • Mais moi aussi, toute ma vie, j’ai absorbé et recomposé les idées des autres
      C’est dans la nature humaine d’appeler cela sa propre création et d’en être fier
    • Si une machine absorbe mon travail et diffuse de nouvelles idées auprès d’innombrables personnes, cela a aussi sa valeur
      La propriété intellectuelle (IP) ressemble davantage à un mécanisme de motivation psychologique qu’à un principe moral
      Dans un monde idéal, la recherche se ferait par pure curiosité plutôt que pour un gain personnel, mais le réel n’est pas ainsi
    • Le travail et le produit du travail sont deux choses différentes
      Un salarié est rémunéré pour son travail, tandis que le résultat appartient à l’entreprise
      Un indépendant, lui, possède le résultat, mais ne perçoit aucun salaire pour le travail en lui-même
      Si l’on a publié quelque chose dans un esprit de partage, on a en fait distribué gratuitement son propre capital
      Si l’on veut une contrepartie, il faut le monétiser ou être rémunéré par la marque et la réputation
    • Je pense que la propriété intellectuelle elle-même est une fiction
      Il est ironique que l’arrivée de l’IA ait au contraire poussé davantage de gens à défendre le droit d’auteur
    • Je suis mathématicien, donc personnellement, ce genre de sujet me laisse assez indifférent
  • Affaiblir les droits des créateurs renforce le pouvoir des distributeurs
    Cela produit une structure dans laquelle la majeure partie des gains économiques revient aux intermédiaires de la distribution

    • Mais renforcer le droit d’auteur pousse aussi parfois les distributeurs à imposer aux auteurs des contrats de cession forcée des droits
      Des systèmes comme celui de l’Allemagne, où la cession du droit d’auteur n’est pas possible, aident à l’empêcher
    • En réalité, cette dynamique est à l’œuvre depuis longtemps
      Comme dans l’industrie pétrolière, cette structure qui absorbe la richesse à l’étape intermédiaire s’est diffusée dans toute la société
      La frénésie autour de l’IA ressemble elle aussi, au fond, à une prolongation de cette avidité du type « comment récupérer ma part »
    • À l’ère d’Internet, le coût de distribution est presque nul, de sorte que le droit d’auteur renforce plutôt les distributeurs
      Les créateurs ont une capacité de production finie, alors que les distributeurs peuvent accumuler les droits à l’infini
  • La notion de plagiat n’est pas la même dans le roman et dans la recherche académique
    Dans le roman, emprunter des idées peut être acceptable, mais dans le monde académique, l’idée elle-même est l’actif central, donc mentionner la source est indispensable
    Se contenter de reformuler des phrases est la forme la plus habile de plagiat
    Un bon article scientifique est rempli de citations et de références, auxquelles il ajoute ensuite un éclairage nouveau

    • La bonne pédagogie, c’est « reformuler tout en citant »
      Reprendre une phrase telle quelle sans citation, c’est du plagiat, tandis que paraphrase + citation est acceptable
      Cela dit, la frontière du « savoir commun » (common knowledge) reste floue et crée parfois de la confusion
    • Mais pour certains, le “vol d’idées” lui-même est une fiction
      La véritable tragédie de l’ère de l’IA est que les gens ont fini par accepter sans esprit critique la notion de droit d’auteur
  • Je recommande RiP!: A Remix Manifesto et cette vidéo YouTube
    L’œuvre a 20 ans, mais les humains restent au fond des machines à remix
    Je pense que les LLM sont le premier cas de mise en œuvre technique d’une partie de la créativité humaine
    Ils n’ont pas d’émotions, mais les humains leur apportent la qualité et l’émotion en tant que filtre final

  • Si les ingénieurs ont du mal à comprendre la propriété intellectuelle (IP), c’est parce que ce droit repose sur l’intention
    Le fait que les tribunaux infèrent l’intention pour rendre leur jugement ne correspond pas à la manière de penser des ingénieurs

    • Ou bien c’est parce que la classe des « créateurs » a ses revenus en jeu et se retrouve elle-même piégée dans une structure qui justifie la privatisation des idées
  • Le « récit du plagiat » est captivant, comme une tragédie héroïque
    Mais les « entreprises tech » n’ont longtemps pas produit directement de contenu, elles ne faisaient qu’en intermédier l’accès
    Désormais, avec l’IA générative, elles produisent directement du contenu
    La question est alors de savoir si, dans ce processus, elles ont utilisé sans autorisation de vastes ensembles de matériaux protégés par le droit d’auteur ; ce sera aux tribunaux d’en juger
    Au final, ces entreprises intermédiaires continuent malgré tout à collecter des données, à surveiller, puis à utiliser librement ces informations

  • À l’ère de l’IA, la frontière entre plagiat et inspiration est floue
    Il y a débat pour savoir si utiliser ChatGPT relève du plagiat ou d’une collaboration avec un « coauteur IA »
    Même les voix IA utilisées pour la lecture d’articles posent une question semblable : si elles ont appris les caractéristiques vocales de personnes réelles, le problème n’est pas si différent de celui du droit d’auteur

  • On pose la question suivante : « Si personne n’avait jamais écrit de science-fiction, l’IA pourrait-elle vraiment écrire de la science-fiction ? »

    • En réalité, la science-fiction existe depuis les tout premiers récits de l’humanité
      On trouve déjà des éléments imaginaires dans L’Épopée de Gilgamesh ou le Ramayana
      Le genre est trop vaste pour être une notion appropriable
      L’inspiration n’est pas du plagiat
    • On pourrait faire une expérience en prenant un LLM entraîné uniquement sur de vieux matériaux, puis en lui expliquant un style nouveau pour lui faire écrire un roman et voir à quel point le résultat diffère du style réel
    • Au final, l’IA ne peut générer un nouveau genre qu’à condition d’avoir des données d’entraînement
      Il lui serait difficile de produire de la science-fiction sans aucune base préalable
    • L’IA n’écrit rien sans prompt d’entrée. Il ne faut pas l’oublier