1 points par GN⁺ 2023-12-29 | 1 commentaires | Partager sur WhatsApp

Le New York Times engage un procès en droits d’auteur contre OpenAI

  • Le New York Times a intenté une action en justice pour violation du droit d’auteur contre OpenAI et son partenaire Microsoft.
  • Des éléments de preuve ont été présentés montrant que des systèmes basés sur GPT développés par OpenAI peuvent reproduire des articles du New York Times.
  • Le New York Times a décidé de poursuivre OpenAI sur la question des licences après l’échec des négociations.

Le journalisme coûte cher

  • Le New York Times engage des dépenses importantes, notamment pour mener un journalisme d’investigation essentiel grâce à des journalistes spécialisés dans de nombreux domaines.
  • Le journal génère des revenus grâce à un paywall strict et limite l’utilisation de ses œuvres via des notifications de droits d’auteur et des conditions d’utilisation.
  • La plainte affirme que les outils développés par OpenAI portent atteinte à ce modèle de monétisation.

Pas seulement l’entraînement

  • Plusieurs poursuites ont été engagées au sujet de l’utilisation de contenus protégés par le droit d’auteur pour entraîner des systèmes d’IA.
  • L’action du New York Times montre comment des contenus absorbés pendant l’entraînement peuvent réapparaître lors de l’utilisation.
  • La plainte inclut des cas où GPT-4 reproduit presque mot pour mot des articles du New York Times.

Atteinte à la réputation et autres préjudices

  • La plainte souligne que les « hallucinations » de l’IA peuvent nuire à la réputation du New York Times et avoir des effets négatifs sur la santé humaine.
  • Des articles de Wirecutter, propriété du New York Times, ont également vu leur contenu protégé utilisé sans autorisation, avec suppression des liens de monétisation.
  • La plainte vise OpenAI et Microsoft pour violation du droit d’auteur, du DMCA, des droits des marques, entre autres.

Avis de GN⁺ :

  • Cet article montre bien les problèmes qui surgissent lorsque les progrès de l’IA entrent en conflit avec des cadres juridiques existants comme le droit d’auteur.
  • Les tensions entre titulaires de droits et développeurs d’IA pourraient déclencher d’importants débats juridiques et éthiques sur l’avenir de l’IA.
  • Le fait qu’un grand média comme le New York Times engage une action en justice contre la technologie d’IA pourrait créer un précédent important pour définir la régulation et les lignes directrices sur la manière dont l’IA génère et distribue des contenus.

1 commentaires

 
GN⁺ 2023-12-29
Avis Hacker News
  • Question de savoir si le fait de scraper des articles du New York Times (NYT) pour créer un produit relève du fair use

    • L’auteur s’interroge sur le fait de savoir si utiliser légalement des articles du NYT scrapés pour créer un produit, puis les résumer et les réécrire afin de les proposer contre paiement, relève du fair use.
    • Il souligne la différence avec les moteurs de recherche : ceux-ci ne remplacent pas l’original et fournissent des références, tandis qu’un produit de résumé peut se substituer à un abonnement au NYT.
  • Perspectives sur le procès en droits d’auteur du NYT

    • Certains avancent que les LLM (grands modèles de langage) de nouvelle génération seront entraînés uniquement sur des données « synthétiques » non soumises au droit d’auteur, ce qui éliminerait les problèmes de contrefaçon.
    • Avis selon lequel les États-Unis ne pourront pas empêcher ce progrès technologique et que d’autres pays prendront de l’avance.
    • Point de vue selon lequel l’évolution complexe des modèles d’IA et le flou sur l’origine des données empêcheront le droit d’auteur de suivre le rythme.
  • Évaluation de la copie d’œuvres du NYT par ChatGPT/Bing Copilot

    • L’auteur estime que les cas où ChatGPT et Bing Copilot recopient mot pour mot des articles du NYT ne relèvent pas du fair use.
    • Le procès ne porte pas seulement sur la copie simple, mais soutient aussi que la copie non autorisée d’articles pour entraîner des LLM constitue une violation du droit d’auteur.
    • Avis selon lequel le débat devrait se concentrer sur la question juridique de savoir si le modèle peut être considéré comme « transformateur ».
  • Inquiétudes autour du « fair use » soulevé par le procès

    • Expression d’une inquiétude face au risque que quelques entreprises monopolisent la valeur d’Internet.
    • Souhait que les tribunaux fixent des règles dans ce domaine.
  • Lien vers les documents du procès du NYT et résumé de leur contenu

    • Partage d’un lien vers un document montrant clairement des cas où ChatGPT cite textuellement des contenus protégés par le droit d’auteur.
    • Question sur le degré de transformation nécessaire d’un contenu protégé pour que le droit d’auteur ne s’applique plus.
    • Discussion sur la possibilité pour OpenAI de bloquer via l’interface web les fuites de contenus protégés.
  • Critique de la perception de certains développeurs selon laquelle les LLM seraient comparables aux humains

    • Critique de l’idée, chez certains développeurs, que les LLM utilisent les articles du NYT comme un humain utiliserait des supports pédagogiques.
    • Il est souligné que le fait que les LLM soient complexes ne change pas le fait que des contenus protégés aient été intégrés au code source.
  • Attentes de monétisation des entreprises de contenu

    • Des entreprises de contenu, dont le NYT, attendent une rémunération pour l’utilisation de leurs contenus dans l’entraînement des LLM.
    • Reddit, Discord et Twitter sont mentionnés comme envisageant, ou ayant déjà commencé, à vendre des contenus pour l’entraînement de l’IA.
  • Argumentation juridique du NYT sur l’usage des LLM

    • Analyse de l’argument du NYT selon lequel la manière dont ses contenus sont utilisés pour entraîner des LLM constitue une violation du droit d’auteur.
    • Comparaison entre les critiques visant les grandes entreprises qui vendent l’accès aux LLM et une attitude plus tolérante envers les usages personnels ou de recherche académique.
  • Prévisions sur les usages futurs des LLM

    • Argument selon lequel, à l’avenir, lorsque des LLM seront intégrés à des machines interagissant avec le monde physique, lire des contenus protégés deviendra illégal.
    • Point de vue selon lequel les robots ne pourront plus conserver en mémoire des contenus protégés après avoir regardé la télévision, lu des livres de bibliothèque ou effectué des recherches sur Internet.
  • Avis selon lequel les LLM devraient relever du fair use en tant qu’« œuvre transformatrice »

    • Opinion personnelle selon laquelle les LLM relèvent du fair use en tant qu’œuvre transformatrice.
    • Intérêt exprimé pour la décision que le système juridique rendra à ce sujet.