2 points par GN⁺ 2023-12-31 | 1 commentaires | Partager sur WhatsApp

Perspectives sombres pour l’IA créative

  • Les systèmes d’IA créative sont entraînés sur des contenus protégés par le droit d’auteur et peuvent générer des contenus susceptibles d’enfreindre ce droit.
  • OpenAI ne fait pas preuve de transparence sur les données ayant servi à l’entraînement de ses systèmes.
  • Les utilisateurs peuvent enfreindre le droit d’auteur sans disposer d’informations sur l’origine des images générées.

Limites des systèmes

  • Des systèmes comme DALL-E et ChatGPT sont fondamentalement des « boîtes noires », et leur capacité à retracer ou fournir les sources reste aujourd’hui insuffisante.
  • Tant qu’une nouvelle architecture permettant la traçabilité des sources n’aura pas été développée, les violations du droit d’auteur se poursuivront, indépendamment de l’intention des utilisateurs.

Risques juridiques et financiers

  • Le procès intenté par le New York Times n’est que le premier d’une longue série de poursuites visant l’IA créative, et même en cas de règlement, son coût devrait dépasser plusieurs millions de dollars.
  • Non seulement OpenAI, mais aussi Microsoft, qui utilise Dall-E via Bing, s’expose à des risques juridiques.

L’avis de GN⁺

  • Les progrès de l’IA créative accroissent le risque de violation du droit d’auteur, ce qui en fait un enjeu majeur alimentant les tensions entre technologie et cadre juridique.
  • Le fait que les utilisateurs ne puissent pas connaître l’origine des contenus générés est un élément clé qui alimente le débat sur l’éthique et la transparence de l’IA.
  • Cet article offre un éclairage intéressant sur les effets secondaires imprévus que pourrait entraîner le développement rapide de l’IA, ainsi que sur son impact sur les secteurs concernés.

1 commentaires

 
GN⁺ 2023-12-31
Avis sur Hacker News
  • Résumé du premier commentaire :

    • L’une des raisons du succès de Disney est d’avoir adapté des récits préexistants, comme des contes populaires transmis de génération en génération.
    • La culture est un bien commun qui évolue et grandit grâce à la narration collective et à la réinterprétation.
    • Le débat actuel sur l’IA et la violation du droit d’auteur tend à négliger cet aspect fondamental de l’évolution culturelle.
    • Il ne faut pas ignorer les implications juridiques ni le contexte historique de la narration culturelle pour comprendre la nature d’une société créative.
  • Résumé du deuxième commentaire :

    • Dans l’Union européenne (UE), les articles 3 et 4 de la « directive sur le droit d’auteur dans le marché unique numérique » encadrent déjà cette question.
    • Toute personne, y compris les développeurs de machine learning (ML) à des fins commerciales, ne peut utiliser des œuvres légalement accessibles que si les ayants droit n’en ont pas explicitement réservé l’usage pour le text and data mining.
    • L’idée d’un équivalent à robots.txt pour signaler ce qui ne doit pas servir à l’entraînement est discutée, et les utilisateurs finaux doivent faire preuve de prudence dans l’usage des contenus générés.
  • Résumé du troisième commentaire :

    • On sait déjà qu’une IA entraînée sur des contenus protégés par le droit d’auteur peut produire des résultats similaires.
    • Les grandes entreprises ont déjà adopté cette approche, et la situation est désormais irréversible.
    • Comme le grand public comprend encore mal la manière dont l’IA est produite et les questions de droit d’auteur, la vraie question est désormais : « que fait-on maintenant ? »
  • Résumé du quatrième commentaire :

    • La responsabilité de garantir qu’il n’y a pas de violation du droit d’auteur incombe à la personne qui publie l’œuvre.
    • Supposer que ChatGPT ou d’autres outils ne généreront pas de contenu protégé par le droit d’auteur est naïf.
  • Résumé du cinquième commentaire :

    • Le but fondamental de l’art et de l’édition devrait être d’influencer la culture et la société, et non simplement de gagner de l’argent.
    • Les œuvres créatives ont besoin de protection, mais leur passage dans le domaine public devrait se faire bien plus rapidement afin de nourrir la créativité et l’inspiration.
  • Résumé du sixième commentaire :

    • La résolution du problème ne semble pas très difficile.
    • Une expression comme « plombier de jeu vidéo » est un raccourci qui désigne une entité précise, que la plupart des gens associent à « Mario ».
    • Il ne serait pas difficile d’utiliser des outils d’IA pour décrire des images ressemblant à Mario et supprimer ce type de résultat lorsqu’un utilisateur demande un « plombier de jeu vidéo ».
  • Résumé du septième commentaire :

    • Le précédent juridique pour l’IA générative serait similaire au fait que Google scrape des sites web et les indexe pour la recherche.
    • Personne ne dit que le fait pour Google d’afficher tel quel le contenu original de sites web constitue une violation du droit d’auteur.
    • Si l’IA générative devait éliminer toutes les références culturelles et toutes les propriétés intellectuelles (IP) populaires, elle deviendrait inutile.
  • Résumé du huitième commentaire :

    • Réflexion sur la question de la violation du droit d’auteur lorsqu’on engage des musiciens de session pour rejouer des extraits de morceaux célèbres et les utiliser comme samples.
    • La question de savoir qui devrait être tenu responsable d’une violation du droit d’auteur est soulevée.
  • Résumé du neuvième commentaire :

    • Mention d’un fil de discussion connexe en cours dans lequel le New York Times demande la destruction de tous les grands modèles de langage (LLM) entraînés sur ses données.
  • Résumé du dixième commentaire :

    • Une expérience sur la capacité du modèle Llama2 à compresser du texte a montré que le modèle contient une part importante du premier chapitre des livres Harry Potter.