2 points par GN⁺ 2025-05-13 | 1 commentaires | Partager sur WhatsApp
  • Le Bureau américain du droit d’auteur a récemment reconnu officiellement des cas de violation du droit d’auteur par des entreprises d’IA
  • Il souligne que les algorithmes d’IA utilisent d’immenses volumes d’œuvres protégées et que le consentement ainsi qu’une rémunération des créateurs sont nécessaires
  • Le rapport conclut que, dans certaines situations, la défense fondée sur le fair use ne s’applique pas
  • De grands acteurs comme OpenAI, Google, Meta, Microsoft sont déjà engagés dans des procédures judiciaires sur cette question
  • La situation se complexifie encore avec la combinaison de politiques favorables à l’IA et d’un limogeage politique

Aperçu du rapport du Bureau américain du droit d’auteur et du limogeage de sa directrice

  • Le limogeage de la directrice du Bureau américain du droit d’auteur est intervenu juste après qu’un rapport a conclu que les entreprises développant des modèles d’IA avaient dépassé le cadre traditionnel du fair use dans leur utilisation d’œuvres protégées
  • Ce rapport présente les conclusions du troisième projet de rapport consacré au droit d’auteur et à l’IA
  • Le premier rapport portait sur les problèmes de reproduction numérique, le deuxième examinait la possibilité de protéger par le droit d’auteur les résultats de l’IA générative

Principaux points du projet de rapport

  • Le 9 mai, un projet de rapport (PDF) sur l’utilisation d’œuvres dans le développement de systèmes d’IA générative a été publié
  • Il apparaît clairement que les systèmes d’IA utilisent d’énormes volumes de données, c’est-à-dire des contenus protégés par le droit d’auteur
  • La question se pose de savoir si l’IA doit obtenir le consentement des titulaires de droits ou les rémunérer
  • Il s’agit du point central de plusieurs procédures judiciaires en cours
  • Les entreprises d’IA ont reconnu avoir entraîné leurs produits à partir de contenus récupérés sans autorisation sur Internet et ailleurs

Jurisprudence sur le fair use et critères d’appréciation

  • Les entreprises d’IA soutiennent qu’il n’existe pas de problème juridique au regard de la clause de fair use du droit d’auteur
  • Les juges soulignent toutefois que le critère déterminant est de savoir si cela affecte « le marché potentiel ou la valeur de l’œuvre originale »
  • Si l’impact n’est pas important, cela peut relever du fair use
  • Le rapport indique explicitement que, dans certaines situations, la défense des entreprises d’IA fondée sur le fair use ne peut pas être retenue

Impact du rapport et réactions du monde universitaire

  • Le rapport final devrait être publié prochainement sans changements majeurs
  • Le juriste Blake. E Reid estime que ce rapport est « très défavorable aux entreprises d’IA » et qu’il « pourrait conduire directement à des défaites devant les tribunaux »
  • Google, Meta, OpenAI et Microsoft figurent actuellement parmi les parties à des litiges liés au droit d’auteur

Contexte du limogeage et dimension politique

  • Le moment choisi pour le limogeage, coïncidant avec la publication du rapport, a suscité des doutes sur la position officielle selon laquelle celui-ci aurait été publié « en réponse aux questions du Congrès et des parties prenantes »
  • Le professeur Reid souligne que la publication précipitée du rapport par le Bureau du droit d’auteur pourrait être le signe de mesures internes de purge
  • Des informations ont effectivement fait état du limogeage de la directrice Shira Perlmutter par l’administration Trump

Retombées politiques et lien avec Elon Musk

  • Le représentant Joe Morelle a relevé que le limogeage est intervenu juste après que la directrice du Bureau du droit d’auteur n’a pas approuvé la demande d’Elon Musk d’utiliser des œuvres protégées pour entraîner des modèles d’IA
  • Musk et Jack Dorsey ont notamment plaidé pour la « suppression de toutes les lois sur la propriété intellectuelle (IP) », tandis que des évolutions politiques se dessinent aussi à travers des posts sur X (anciennement Twitter) favorables à l’entraînement de l’IA

Autres motifs possibles du limogeage

  • Étant donné que le Bureau du droit d’auteur dépend de la Bibliothèque du Congrès des États-Unis (Library of Congress), il est mentionné que cette décision pourrait aussi être liée au récent renvoi de la directrice de la Bibliothèque autour de politiques de diversité (DEI) et de controverses sur la sélection de livres pour enfants
  • Le limogeage semble donc résulter d’un enchevêtrement de facteurs internes et politiques, liés à la politique sur l’IA, à de grands donateurs ou encore aux politiques DEI

1 commentaires

 
GN⁺ 2025-05-13
Avis sur Hacker News
  • Il est souligné que si les États-Unis empêchent les LLM d’utiliser des contenus protégés par le droit d’auteur, ou imposent une compensation à tous les ayants droit, d’autres pays comme la Chine ne feront probablement pas de même. Dans ce cas, les entreprises américaines de LLM risqueraient d’être distancées dans la concurrence ou pénalisées par des coûts supplémentaires. Au final, des pays comme la Chine pourraient prendre de l’avance en matière d’utilité de l’IA. Bien sûr, on peut penser qu’il faut faire ce qui est juste, mais dans les décisions gouvernementales sur la régulation de l’IA, il y a en arrière-plan l’inquiétude de savoir qui détiendra le leadership dans le monde de demain
    • Suivant cette logique, un citoyen ordinaire pourrait aussi conclure qu’il est acceptable de blanchir la propriété intellectuelle des entreprises, puisque la Chine ne les rattrapera jamais sur ce point. Si l’autre camp trouve ça acceptable, je m’y joindrai aussi
    • Dans l’ensemble, je suis d’accord pour dire qu’un accès totalement libre aux contenus protégés pourrait rendre l’IA plus puissante. En revanche, je me demande ce que signifie exactement « plus puissante ». Du point de vue de la sécurité nationale, je suis favorable à un accès total des LLM aux informations académiques, scientifiques et techniques. J’ai plus de réserves sur le code propriétaire, même s’il existe déjà énormément de données de code. Mais je ne vois pas quel avantage concret il y aurait à donner aux LLM un accès total aux contenus protégés, par rapport à un accès limité aux articles scientifiques, aux données techniques et aux contenus sous licence. Au final, cela transformerait surtout les LLM en machines à plagiat beaucoup plus efficaces, sans les rendre réellement plus intelligents. Le même raisonnement vaut pour les modèles d’image et de vidéo. Avec l’accès aux contenus protégés, ils pourront produire plus d’images ou recréer Mario et Luigi dans une infinité de scénarios, mais comme cela n’apporte aucun bénéfice réel, ces modèles devraient plutôt être interdits. Il n’y a là ni avantage majeur pour la sécurité ni avantage économique
    • Le vrai problème, c’est que les entreprises d’IA ne cherchent même pas à faire changer la loi comme le font les grands groupes traditionnels
    • Par ailleurs, si un président peut imposer 145 % de droits de douane à la Chine, il pourrait aussi taxer à 1000 % les chatbots chinois sur Internet, voire couper les câbles Internet au nom d’une urgence nationale. On ne sait pas ce que fera la Chine à l’avenir, mais elle interdira probablement au moins l’usage de l’IA aux mineurs. L’usage militaire est une question distincte du droit d’auteur
    • Si l’IA est vraiment si importante, alors elle devrait appartenir à l’État et être accessible gratuitement à tous les citoyens
    • Ce raisonnement pourrait s’appliquer non seulement à l’IA, mais à toutes les violations de propriété intellectuelle
    • J’ai personnellement du mal à croire que les LLM contribueront réellement à dominer le monde, mais l’esprit de compétition est clairement au cœur de ce débat
    • Autrefois, installer des copies piratées de Windows ne posait apparemment aucun problème. La BSA est arrivée, mais désormais Microsoft ferme les yeux parce que cela l’arrange
  • Licencier quelqu’un pour cette raison est très étrange. Cela ressemble à une tentative de censurer une interprétation du droit. À mon avis, entraîner des modèles sur des contenus protégés est, dans une lecture traditionnelle du droit, clairement illégal. Bien sûr, un humain peut lire un livre, s’en inspirer et écrire un nouveau livre sans être poursuivi. Quand on regarde la masse des romans de fantasy, on voit bien qu’ils ne sont pas tous totalement indépendants les uns des autres. Mais puisque l’IA est utile et innovante, il faut reconnaître que la loi n’avait pas prévu ce cas de figure et qu’il faut donc la modifier
    • On dit qu’un humain qui lit un livre et écrit ensuite sous l’effet de l’inspiration n’est pas poursuivi, mais dans les faits, les cas de personnes « trop inspirées » qui se retrouvent poursuivies sont fréquents. Les litiges pour plagiat musical sont bien connus
    • Le droit couvrait déjà largement cette question, mais cela montre une fois de plus que les puissants se placent au-dessus des lois. Il aurait été tout à fait possible de limiter cela en n’utilisant que des contenus anciens, des contenus sous Creative Commons, en s’assurant que les sorties restent à une certaine distance éditoriale de l’original, ou en contactant les ayants droit pour obtenir une autorisation. Or, les entreprises d’IA ne font rien de tout cela
    • L’IA n’est pas un être humain. Le fait que les humains aient des droits ne permet pas d’en déduire immédiatement que les machines doivent en avoir aussi. Sinon, mettre une voiture à la casse deviendrait un homicide
    • Les humains ne peuvent pas non plus faire ce que les entreprises d’IA essaient de faire. C’est comme un étudiant qui irait à la bibliothèque en disant : « Je veux copier tous les livres pour apprendre. » Les humains aussi sont utiles et innovants
    • Il faut aussi reconnaître qu’être utile ne signifie pas automatiquement que c’est une bonne idée
    • Si le droit d’auteur disparaît, les entreprises seront furieuses, et le système des brevets s’effondrera aussi. Les entreprises américaines perdront leur domination mondiale. On pourrait bientôt redéfinir le maintien du droit d’auteur comme n’ayant plus pour seule raison d’être que la lutte contre le piratage des médias, et les institutions existantes risqueraient de se transformer en organes de contrôle et de censure
    • On peut librement écrire un autre roman inspiré, mais publier officiellement quelque chose comme « Hairy Plotter and the Philosophizer's Rock » ne serait probablement pas permis
    • Le problème de l’analyse, c’est qu’elle ne discute même pas de la raison d’être du droit d’auteur. Croire à la fois que « les LLM devraient pouvoir s’entraîner sur des contenus sans autorisation » et que « le droit d’auteur a un sens » est incompatible. Dans la Constitution américaine, le droit d’auteur vise à favoriser le progrès des sciences et des arts ; dans l’UE, il sert à protéger les créateurs et à encourager la créativité. Si, après la publication de mon livre, des entreprises technologiques peuvent le copier pour l’entraînement puis le redonner aux consommateurs, plus personne n’achètera mon livre. Alors l’investissement s’arrêtera et les livres ne seront plus créés
    • Fournir dans un modèle, à des fins commerciales, de la propriété intellectuelle sans licence n’est pas une exception
    • Si l’on change la loi, cela doit s’appliquer à tout le monde, et non constituer un privilège réservé aux entreprises d’IA
    • Si l’on a considéré qu’un humain qui s’inspire d’une œuvre protégée pour créer n’enfreint pas le droit d’auteur, il faut alors expliquer clairement pourquoi cela devient un problème quand c’est un robot qui le fait. Si l’on estime qu’un robot introduit, par interprétation, une dynamique intrinsèquement nouvelle, alors il faut construire un argument applicable et exécutoire
    • Je ne pense pas que l’IA soit une technologie si utile que ça. Elle existe depuis les années 1950 et ce n’est que maintenant qu’elle devient vaguement exploitable, tout en fonctionnant encore mal
    • Regarder des films piratés peut aussi être utile, mais cela ne le rend pas légal. Les humains et l’IA sont totalement différents, et l’argument de l’inspiration humaine n’a aucun fondement
    • Pour chanter une reprise, il faut une autorisation, et sans autorisation cela peut être illégal. En revanche, écrire une chanson inspirée en est légal. Si l’œuvre générée par l’IA est suffisamment nouvelle et transformative, il n’y a pas de problème ; mais si elle copie directement l’œuvre d’autrui, alors c’en est un. Le droit devrait juger sur la différence réelle entre les résultats, pas sur des notions floues comme l’âme ou l’inspiration
    • Les entreprises et l’IA ne sont ni des humains ni des écureuils. On peut se demander quel est l’intérêt de les comparer aux humains
    • Je comprends le ressenti des créateurs qui résistent à l’idée qu’un logiciel puisse reconstituer leur propriété intellectuelle sans autorisation. Je me demande simplement si le fait même de lire des données constitue une violation du droit d’auteur. Lire ou résumer n’a jamais été encadré par le droit existant. Des affirmations comme « les gens ne doivent pas lire le livre que j’ai diffusé », « les gens ne doivent pas écrire de fanfic dans mon style », ou « les gens ne doivent pas s’entraîner à copier des chefs-d’œuvre dans un musée » sont déconnectées de la réalité. Il nous faut ici un débat social plus raisonnable et une orientation plus claire
  • Une femme du Minnesota a été condamnée à 220 000 dollars d’amende pour le téléchargement illégal de 24 chansons
    • Il est souligné que ce cas est différent de l’entraînement des modèles par les entreprises d’IA. L’apprentissage à partir de données par une entreprise d’IA ne reviendrait pas à partager ou distribuer directement les chansons à d’autres
  • Jusqu’à présent, je n’ai jamais vu quelqu’un expliquer en détail à la fois la structure technique de l’entraînement des modèles Transformer et l’accusation de violation du droit d’auteur. Autrement dit, il est rare de trouver quelqu’un qui maîtrise à la fois le mécanisme d’entraînement des modèles et le raisonnement juridique sur la contrefaçon. Ici, il est question du processus d’entraînement, pas du résultat généré lors de l’inférence
    • Le problème apparaît quand un Transformer reproduit des contenus pour lesquels il n’avait pas d’autorisation, et cela peut en soi suffire à justifier une action en justice. En revanche, il n’est pas clair que le simple fait de toucher à une masse énorme de contenus protégés constitue, en soi, une violation du droit d’auteur. Les créateurs et les artistes ont évidemment un intérêt dans les produits dérivés de leurs œuvres. Si mon œuvre devient inutile, il suffit de l’exclure
    • L’exploitation du modèle en elle-même n’est pas une violation du droit d’auteur, et l’entraînement à des fins d’analyse ou de recherche est acceptable. Mais l’usage commercial, la substitution au marché, etc., sont considérés comme allant au-delà du fair use
    • Je me demande aussi en quoi ce mode d’entraînement diffère des transformées utilisées dans les codecs vidéo, et quelle différence il y a entre la compression avec perte et la violation du droit d’auteur
    • Alors qu’on n’arrive déjà pas à expliquer de façon structurelle les comportements humains, comme le fait d’écrire exactement la même phrase, il n’existe pas de discussion claire sur la raison pour laquelle l’entraînement de l’IA constituerait une violation. En d’autres termes, il n’y a pas de débat qui traite à la fois de la lecture et du plagiat
    • Le cœur de cette controverse est que les entreprises d’IA n’achètent pas les livres ni ne paient de droits pour les utiliser ; elles les téléchargent sans autorisation
    • Peu importe la manière exacte dont cela fonctionne : ce qui compte, c’est ce que cela produit au final
    • Les profils combinant programmeur et avocat spécialisé en droit d’auteur sont rares, mais ils existent. Au bout du compte, ce qui compte, c’est la décision de justice. Dans cette affaire, ce point ne sera peut-être même pas déterminant
    • Quand une machine copie l’œuvre de quelqu’un d’autre, c’est une violation du droit d’auteur. Les humains et les machines ne sont pas la même chose, et tant que cela n’a pas été démontré, la loi ne l’autorise pas
    • Cette personne affirme disposer de preuves de contrefaçon et partage des références
    • Ceux qui connaissent la structure de l’entraînement ont plutôt tendance à penser qu’il ne s’agit pas d’une violation du droit d’auteur
  • Le projet de rapport publié donne l’impression de simplement énumérer les plaintes des ayants droit. Les fondements des arguments ne semblent pas très approfondis
    • Des fondements approfondis ne sont pas nécessaires. Si une IA lit 100 articles scientifiques et publie ensuite un nouvel article, c’est du plagiat. Si une personne à la mémoire parfaite réarrange des textes existants pour en faire un nouveau, c’est aussi une violation du droit d’auteur. Seuls les grands groupes semblent bénéficier d’une exception
    • Cela ne se réduit pas à une simple liste de doléances. Certains y voient une tentative des ayants droit de contourner l’évolution défavorable de la jurisprudence en neutralisant le principe du fair use
    • Je n’ai pas vraiment envie de les plaindre
  • Je ne peux pas être d’accord avec l’idée que, si l’IA utilise commercialement d’immenses quantités d’œuvres protégées pour créer des contenus en concurrence avec les marchés existants, cela dépasse forcément le fair use. Je me demande pourquoi puiser un peu partout dans diverses sources pour créer quelque chose de façon créative ne relèverait pas du fair use. Au fond, ce débat revient à s’interroger sur l’intérêt public et sur la finalité profonde du droit d’auteur
  • Il est souligné que l’administration actuelle multiplie les actions en faveur de groupes d’intérêts particuliers
  • Il est recommandé de consulter le PDF « Copyright and Artificial Intelligence Part 3: Generative AI Training »
  • J’ai le sentiment que le droit de la propriété intellectuelle est en train de devenir un outil de contentieux pour les grandes entreprises, au détriment de la diffusion des idées. Si le fait de connaître l’intégralité d’un livre devient illégal, il devient alors flou de savoir jusqu’où l’on peut restreindre le simple fait d’encoder un certain niveau de connaissance de son contenu. Quand un juge tranche cela, il ne s’agit plus seulement de copie commerciale, mais du contrôle du savoir collectif de l’humanité
  • Certains disent avoir l’impression de revoir encore une fois la même controverse que lors des débats précédents