1 points par GN⁺ 2023-07-10 | 1 commentaires | Partager sur WhatsApp
  • La comédienne et autrice Sarah Silverman, ainsi que Christopher Golden et Richard Kadrey, ont porté plainte contre OpenAI et Meta pour violation du droit d’auteur.
  • La plainte affirme que ChatGPT d’OpenAI et LLaMA de Meta ont été entraînés sur des jeux de données obtenus illégalement, incluant leurs œuvres.
  • Les auteurs soutiennent que leurs livres étaient accessibles dans les jeux de données que Meta a utilisés pour entraîner le modèle LLaMA.
  • La plainte comprend six chefs d’accusation portant sur divers types de violation du droit d’auteur, la négligence, l’enrichissement injustifié et la concurrence déloyale.
  • Les auteurs réclament notamment des dommages-intérêts légaux et la restitution des profits.
  • Les avocats représentant les auteurs disent avoir été contactés par d’autres auteurs, écrivains et éditeurs inquiets de la capacité de ChatGPT à générer des textes similaires à des contenus protégés par le droit d’auteur.
  • Des plaintes similaires avaient déjà été déposées par le passé contre des entreprises d’IA remettant en cause les limites du droit d’auteur.
  • L’issue de cette affaire pourrait avoir des répercussions majeures sur l’industrie de l’IA et le droit d’auteur.
  • Meta, OpenAI et le cabinet Joseph Saveri Law Firm n’ont pas répondu aux demandes de commentaire.

1 commentaires

 
GN⁺ 2023-07-10
Commentaires Hacker News
  • Une plainte allègue qu’OpenAI et Meta ont utilisé, dans leurs jeux de données d’entraînement, des œuvres protégées par le droit d’auteur provenant de sites pirates de livres.
  • Le fait que des modèles d’IA puissent résumer des livres à partir de contenus protégés sans y accéder directement soulève des questions.
  • Une distinction est faite entre les données d’entraînement librement accessibles et les contenus obtenus illégalement via des torrents.
  • La légalité de l’utilisation de torrents pirates pour entraîner des modèles d’IA fait débat.
  • La question de la présence du livre de Sarah Silverman dans les données d’entraînement est discutée, certains estimant qu’il pourrait s’agir d’un cas manifeste de violation.
  • L’usage transformatif est envisagé comme moyen de défense potentiel, dans la mesure où les modèles d’IA résument les livres en les réduisant à des faits.
  • La question du partage, sans autorisation, d’informations apprises par des modèles d’IA est soulevée.
  • La possibilité que les modèles d’IA synthétisent eux-mêmes des résumés à partir de critiques et de résumés de livres présents dans les données d’entraînement est examinée.
  • Le deux poids, deux mesures entre les particuliers poursuivis pour usage de torrents et les modèles d’IA utilisant des contenus piratés est critiqué.
  • La capacité des modèles d’IA à fournir des citations exactes issues de livres protégés par le droit d’auteur soulève des interrogations.
  • La possibilité d’un recours collectif contre OpenAI et Meta est discutée, mais la faisabilité et la rentabilité de telles poursuites restent incertaines.