1 points par GN⁺ 2023-09-08 | 1 commentaires | Partager sur WhatsApp
  • Si un client commercial est poursuivi pour violation du droit d’auteur en raison de l’utilisation de Copilot ou de ses résultats, Microsoft assurera sa défense et prendra en charge le montant d’un jugement défavorable ou d’un règlement amiable
  • Cette promesse étend l’indemnisation existante en matière de propriété intellectuelle aux services Copilot commerciaux, y compris Microsoft 365 Copilot, GitHub Copilot et Bing Chat Enterprise
  • Les clients doivent utiliser les filtres de contenu et garde-fous intégrés aux produits, et ne pas tenter de créer des contenus contrefaisants avec des entrées pour lesquelles ils ne disposent pas des droits
  • Selon la mise à jour du 5 janvier 2024, l’engagement a été renommé Customer Copyright Commitment et étendu aux clients commerciaux d’Azure OpenAI Service
  • Microsoft ne revendique pas de droits de propriété intellectuelle sur les résultats de Copilot et estime qu’il faut traiter conjointement les questions de droit d’auteur, de rémunération des créateurs et de concurrence autour de l’IA générative

Engagement de responsabilité sur le droit d’auteur pour Copilot

  • Microsoft a lancé le Copilot Copyright Commitment pour répondre aux inquiétudes des clients selon lesquelles l’utilisation des résultats d’une IA générative pourrait donner lieu à des plaintes pour violation du droit d’auteur
  • Si un client commercial est poursuivi par un tiers pour violation du droit d’auteur à cause d’un service Microsoft Copilot ou de ses résultats, Microsoft assurera sa défense et paiera le montant d’un jugement défavorable ou d’un règlement amiable
  • Pour en bénéficier, le client doit utiliser les garde-fous et filtres de contenu intégrés aux produits Microsoft
  • Microsoft considère que, dès lors qu’il facture Copilot à ses clients commerciaux, les problèmes juridiques liés à son usage doivent être assumés par Microsoft et non par le client

Champ d’application et conditions pour les clients

  • Le Copilot Copyright Commitment étend l’indemnisation IP existante de Microsoft aux réclamations liées à l’usage des Copilot basés sur l’IA et aux résultats associés
  • Sont concernés les services Copilot commerciaux payants de Microsoft ainsi que Bing Chat Enterprise
    • Microsoft 365 Copilot : fournit de l’IA générative dans Word, Excel, PowerPoint et d’autres applications, et permet aux utilisateurs de raisonner à partir de leurs propres données ou de transformer des documents en présentations
    • GitHub Copilot : aide les développeurs à réduire le temps consacré au codage répétitif et à consacrer plus de temps à des résultats nouveaux et transformationnels
  • Les clients doivent utiliser les filtres de contenu et autres systèmes de sécurité intégrés aux produits
  • Ils ne doivent pas tenter de générer des contenus contrefaisants ni fournir aux services Copilot des entrées qu’ils n’ont pas le droit d’utiliser
  • Cet avantage ne modifie pas la position existante de Microsoft selon laquelle l’entreprise ne revendique pas de droits de propriété intellectuelle sur les résultats des services Copilot

Inquiétudes sur le droit d’auteur et équilibre des politiques publiques

  • L’IA générative améliore l’efficacité et la créativité des clients, mais soulève aussi la question de savoir si l’usage de ses résultats peut donner lieu à des plaintes pour atteinte à la propriété intellectuelle
  • Des auteurs et des artistes ont publiquement contesté la manière dont leurs œuvres sont utilisées dans les modèles et services d’IA, et Microsoft estime que ces inquiétudes des clients sont compréhensibles
  • Même si le droit d’auteur existant est clair sur certains points, l’IA générative crée de nouvelles questions de politique publique
  • Microsoft avance simultanément trois objectifs
    • l’IA doit contribuer à la diffusion du savoir et à la résolution de défis sociétaux
    • les créateurs doivent pouvoir contrôler les droits que leur confère le droit d’auteur et tirer des revenus sains de leurs œuvres
    • les contenus nécessaires à l’entraînement des modèles d’IA et à l’ancrage des réponses ne doivent pas être verrouillés par un petit nombre d’entreprises au point de freiner la concurrence et l’innovation

Protections intégrées à Copilot

  • Microsoft a intégré des filtres et d’autres technologies pour réduire la probabilité que Copilot renvoie des contenus contrefaisants
  • Ces protections s’ajoutent aux travaux existants en matière de sûreté numérique, de sécurité et de protection de la vie privée
  • Les garde-fous utilisés comprennent des classificateurs, des méta-prompts, du filtrage de contenu, de la supervision opérationnelle et de la détection des abus
  • La détection des abus inclut aussi les usages susceptibles de porter atteinte à des contenus de tiers
  • Le Copilot Copyright Commitment exige des clients qu’ils utilisent ces technologies, créant ainsi une incitation à mieux prendre en compte les préoccupations liées au droit d’auteur

Extension à Azure OpenAI Service

  • D’après la mise à jour du 5 janvier 2024, Microsoft a étendu le 15 novembre 2023 le Copilot Copyright Commitment en Customer Copyright Commitment
  • Cette extension inclut les clients commerciaux utilisant Azure OpenAI Service
  • Si un client est poursuivi pour violation du droit d’auteur en raison de l’utilisation des résultats d’Azure OpenAI Service, Microsoft assurera également sa défense et paiera le montant d’un jugement défavorable
  • Cette extension vise à répondre davantage aux inquiétudes des clients concernant la responsabilité potentielle en matière d’atteinte à la propriété intellectuelle liée à l’utilisation des résultats de Microsoft Copilot et d’Azure OpenAI Service
  • Pour bénéficier du Customer Copyright Commitment, les clients doivent mettre en œuvre les garde-fous et mesures d’atténuation obligatoires fournis par Microsoft
  • Microsoft fournit pour Azure OpenAI Service de la documentation et des outils destinés à soutenir un usage responsable de l’IA et à réduire le risque d’atteinte à des contenus protégés par le droit d’auteur

Diffusion de l’IA et protection des œuvres

  • Microsoft considère cette mesure comme une première étape et estime que les questions juridiques posées par l’IA devront être résolues par l’industrie avec l’ensemble des parties prenantes
  • Pour les clients, cela se traduit par la promesse que Microsoft assumera la responsabilité liée au droit d’auteur de ses produits
  • Microsoft voit positivement les bénéfices de l’IA tout en reconnaissant les défis et les risques, y compris la protection des œuvres
  • L’entreprise estime qu’il faut coopérer avec l’industrie technologique, les auteurs et artistes ainsi que leurs représentants, les pouvoirs publics, le monde universitaire et la société civile pour gérer ces risques
  • À l’avenir, Microsoft veut poursuivre avec de nouvelles initiatives afin que l’IA fasse progresser la diffusion du savoir tout en protégeant les droits et les besoins des créateurs

1 commentaires

 
GN⁺ 2023-09-08
Avis sur Hacker News
  • Microsoft devrait d’abord publier un modèle Copilot entraîné sur les bases de code internes d’Azure, Windows et Office
    C’est seulement ainsi qu’on pourrait être convaincu que Microsoft croit réellement que Copilot est une technologie qui ne viole pas le droit d’auteur

    • Microsoft aurait sans doute plus d’argent à gagner en le faisant
      Les ingénieurs internes verraient leur productivité augmenter, et la précision s’améliorer nettement, car Copilot serait déjà familier avec les structures de données, le style de code, etc.
      De plus, le code tiers dans le monde entier se rapprocherait progressivement du style Microsoft, ce qui pourrait aussi faciliter le recrutement et la formation
      L’inconvénient que des personnes extérieures puissent obtenir de petits indices sur le code source de Microsoft semble peu significatif, puisqu’on peut déjà obtenir bien plus d’informations en décompilant les binaires
    • Microsoft ne prétend pas que Copilot ne peut pas recracher du code tel quel
      Elle dit simplement qu’elle en assumera la responsabilité si toutes les conditions suivantes sont réunies : une telle sortie a effectivement été produite, l’utilisateur n’a pas désactivé le filtre qui l’empêche, il ne l’a pas provoquée intentionnellement, et cet usage est jugé illégal
      Il y a une différence entre du code qui doit rester privé pour le protéger d’acteurs malveillants, et du code qui est public mais assorti de restrictions d’utilisation que ses destinataires sont censés connaître
      C’est un peu comme l’argument consistant à dire : « si vous croyez que les contrats de licence sont juridiquement valables, publiez le mot de passe de vos utilisateurs avec une licence disant que personne ne doit l’utiliser »
    • Les fuites de données sensibles et les violations du droit d’auteur sont des sujets distincts, mais ce sont des inquiétudes liées
      Même s’il n’y avait absolument aucun risque d’infraction, Microsoft pourrait ne pas vouloir une telle publication
    • La dernière chose dont le monde a besoin, c’est de code écrit dans le style de l’API Win32
    • Il semble qu’il soit ici question de GitHub Copilot, un produit distinct au sein du portefeuille Microsoft
      GitHub Copilot était basé sur GPT-3, affiné avec des dépôts de code publics, et c’est ce point qui est au cœur de la controverse
      Ce billet de blog traite de l’écosystème Microsoft Copilot au sens plus large
      La plupart des outils utilisent en backend le service Azure OpenAI API et ne sont pas spécialisés dans la génération de code
  • L’IA générative a généralement un caractère transformatif, elle a donc de bonnes chances d’être considérée comme relevant du fair use.
    Si on la pousse vraiment dans ce sens, elle peut produire des résultats proches de code ou d’images existants, mais les tribunaux peuvent estimer qu’elle crée globalement du contenu nouveau qui n’existait pas auparavant, et c’est encore plus vrai pour les images.
    Google Books a été considéré comme relevant du fair use alors même qu’il copiait littéralement des livres pour les intégrer à une base de données en ligne ; une IA générative, bien plus transformative, a donc de fortes chances d’entrer plus largement dans le champ des usages équitables possibles.
    Google Books était certes non commercial, mais les tribunaux considèrent généralement que plus le caractère transformatif est fort, moins ils peuvent appliquer strictement les critères du fair use.
    https://ogc.harvard.edu/pages/copyright-and-fair-use

    • Tout le monde dit que « l’IA générative dans son ensemble a de fortes chances d’être reconnue comme relevant du fair use », mais je pense qu’en réalité cette probabilité est inférieure à 50 %.
      Google Books relevait du fair use parce qu’il avait une utilité publique, ne portait pas préjudice aux éditeurs ni aux auteurs, et aidait au contraire les gens à trouver des œuvres protégées.
      À l’inverse, l’IA générative peut extraire l’essentiel des œuvres des gens pour produire des résultats au style similaire, exclure complètement les auteurs d’origine et les priver du fruit de leur travail.
      C’est en particulier un processus purement mécanique, sans créativité humaine autre que ce qui est extrait d’autres auteurs. Un simple prompt peut difficilement être considéré comme de la créativité.
      Au bout du compte, cela ressemble surtout à l’argument selon lequel « on utilise des œuvres protégées, mais comme on les mélange à grande échelle, c’est acceptable ».
    • Si vous avez vu le récent arrêt de la Cour suprême dans Warhol v. Goldsmith, vous savez que le sens de la transformation dans le fair use a été redéfini de manière assez importante.
      Cela va dans un sens défavorable à l’argument selon lequel l’IA générative relèverait du fair use.
      En particulier, comme la Cour a relié le caractère transformatif à l’impact sur le marché, il devient beaucoup plus difficile pour les tribunaux de considérer comme transformative une IA générative qui produit des sorties en concurrence directe avec les œuvres d’entrée.
      C’est encore plus vrai pour la génération d’images, qui concurrence clairement les banques d’images.
    • Le fair use ne fonctionne pas ainsi.
      Il ne peut pas y avoir de garantie globale du type « l’IA générative dans son ensemble relève du fair use », et le fait qu’un résultat soit transformatif ou non n’est qu’un facteur parmi d’autres.
      Il suffit de regarder les affaires de sampling audio ou de remix pour s’en convaincre.
    • Google Books peut être transformatif du point de vue de l’usage et de la nature, mais cela ne signifie pas que prendre les résultats de recherche de Google Books et les coller dans son propre livre relèverait du fair use.
      Il existe des exceptions, par exemple lorsqu’on cite un livre dans un article de recherche, mais ce ne sont que des cas particuliers qu’on peut invoquer pour pinailler dans une discussion en ligne.
      Le fait que Copilot lui-même puisse être une œuvre transformative autorisée à exister n’implique pas qu’un développeur n’encoure aucune responsabilité pour violation du droit d’auteur lorsqu’il intègre ses sorties dans son propre travail.
      De même, on ne peut pas considérer que tous les résultats produits par quelqu’un d’autre sont exempts de problèmes de droit d’auteur. On ne prétend pas qu’une personne devient elle-même une contrefaçon parce qu’elle a vu l’œuvre d’autrui, mais les productions sont une question distincte.
    • Il y a beaucoup d’objections, mais l’UE semble assez d’accord avec ce point de vue : https://creativecommons.org/wp-content/uploads/2021/12/CC-St...
      https://www.notion.so/DSM-Directive-Implementation-Tracker-3...
      https://eur-lex.europa.eu/eli/dir/2019/790/oj
      L’exception TDM4 au droit d’auteur autorise la création de jeux de données composés d’œuvres protégées, tant qu’il existe un mécanisme permettant aux titulaires de droits de s’y opposer.
      Les jeux de données deviennent transparents, les titulaires de droits peuvent exercer leurs droits, et certaines entreprises d’IA peuvent entraîner leurs modèles sur des contenus protégés : cela ressemble au meilleur compromis possible.
      Bien entendu, cela ne confère pas de droits commerciaux sur le modèle entraîné, seulement des droits à des fins de recherche scientifique et universitaire. Par exemple, cela signifie que Meta peut entraîner et publier le modèle LLaMA entraîné sur des livres, à condition de ne pas en tirer profit commercialement et qu’il existe un mécanisme permettant aux auteurs de s’y opposer.
      Je discute avec Jordan de https://spawning.ai pour voir s’il serait possible de créer un système d’opposition adapté aux livres, et on peut imaginer une approche similaire pour la musique.
      C’est du droit européen, mais contrairement à d’autres réglementations excessives de l’UE, cela me paraît être un compromis très raisonnable.
      Mise à jour : Jordan m’a envoyé un e-mail de correction, indiquant que ma compréhension est juste : le droit d’opposition ne s’applique qu’à la recherche commerciale. Cela signifie que créer un jeu de données pour des acteurs comme Eleuther pourrait ne pas nécessiter de procédure d’opposition, alors qu’elle deviendrait nécessaire si OpenAI l’utilisait pour GPT-5 et facturait l’accès.
      Dans ce cas, cette loi s’applique effectivement aux usages commerciaux du machine learning, tandis que les usages non commerciaux comme LLaMA n’auraient même pas besoin de droit d’opposition.
      C’est excellent : elle offre un bouclier juridique aux chercheurs et exige la transparence des jeux de données pour les usages commerciaux.
  • Je me demande s’il existe de vrais détails concrets sur cette annonce
    Je sais que c’est un billet de blog, mais comme tous les liens de la page renvoient seulement vers d’autres billets de blog, cela laisse beaucoup de questions
    Ce billet de blog est-il un contrat juridiquement exécutoire ? Microsoft indemnise-t-il spécifiquement tous les utilisateurs contre les réclamations pour violation du droit d’auteur liées à l’utilisation de Copilot ?
    Le billet dit que « ce programme comporte des conditions importantes » et en énumère quelques-unes, mais on ne sait pas clairement si ce sont toutes les conditions ou s’il en existe d’autres qui ne figurent pas dans l’article
    Par exemple, on ne sait pas si cela ne s’applique qu’à certains pays, ou à tous les systèmes juridiques dans le monde
    Quelle garantie y a-t-il que Microsoft ne mettra pas fin à ce programme ? Si les tribunaux rendent à plusieurs reprises des décisions défavorables, et si Microsoft se rend compte qu’elle n’a pas les moyens d’indemniser chaque fois que Copilot blanchit sous licence de gros morceaux de code protégé par le droit d’auteur, les utilisateurs disposent-ils d’un moyen de contraindre Microsoft à tenir sa promesse ?

    • Donc, pour l’instant, cela ressemble davantage à de la communication qu’à une véritable protection juridique
      Brad Smith, qui est avocat, doit bien le comprendre
      Sinon, pourquoi exposerait-il Microsoft, une entreprise valorisée 2 500 milliards de dollars, au risque d’une garantie de responsabilité illimitée ?
    • Sur la question « ce billet de blog est-il un contrat juridiquement exécutoire ? », c’est possible
      Il existe une notion appelée promissory estoppel
      https://www.nolo.com/dictionary/promissory-estoppel-term.htm...
    • En tant qu’avocat, j’ai cherché cette nouvelle formulation, mais aucun des documents juridiques que j’ai consultés ne semble avoir été mis à jour pour la refléter
      La documentation Microsoft est assez variée, ce qui peut prêter un peu à confusion, mais les documents liés à Copilot sont relativement clairs et, depuis le printemps, les clauses d’indemnisation n’ont pas changé
  • Un mouvement très malin de la part de Microsoft
    En substance, ils se dessinent une énorme cible dans le dos pour les futurs procès, et ils estiment avoir les ressources pour les contester. Ce n’est pas forcément un mauvais calcul
    Vu la direction que prend l’IA, il y aura bientôt une jurisprudence importante
    Du point de vue de Microsoft, il est crucial de faire croître ce marché aussi vite que possible et d’en occuper le centre
    Cette mesure réduit l’un des principaux freins à l’adoption du code généré par les petites organisations : la crainte de se demander « si ce produit génère du code protégé par le droit d’auteur, vais-je être poursuivi ? »

    • Oui. C’est bien là le point essentiel
      Microsoft jette le gant et dit en quelque sorte : « l’énorme machine juridique de Microsoft se battra »
      En gros, c’est une démonstration de force du type : « poursuivez-nous, allez-y. Sinon, rentrez chez vous »
    • Microsoft a aussi l’argent, c’est donc une cible intéressante à poursuivre
    • Microsoft y voit peut-être simplement la moins mauvaise option
      Une façon de verser une partie de l’argent aux cols blancs, comme une taxe supportable, tout en évitant que la pression pour que les pouvoirs publics les encadrent fortement ne monte trop vite
    • À titre de prédiction, ils pourraient utiliser le déploiement cloud pour forker des parties GPL importantes, puis limiter les mises à jour de sécurité nécessaires à leur propre fork et à leur propre implémentation
      Ils gagneront du temps pendant quelques années en contrôlant le discours public et en publiant des communiqués, et consolideront leur position entre-temps
  • Il y a un gros astérisque : « les clients ne doivent pas tenter de générer du contenu contrefaisant »
    Au bout du compte, tout dépend de la manière dont Microsoft définit le fait d’avoir tenté de générer du contenu contrefaisant
    On espère que cela vise seulement les usages où l’utilisateur sait qu’il demande une contrefaçon, comme « reproduis l’intégralité du code source de Half-Life 2 », mais en réalité, on n’en sait rien

    • Honnêtement, sur ce point, je fais confiance à Microsoft
      Je ne crois pas qu’ils pratiquent une concurrence loyale, et je ne leur fais pas confiance comme employeur
      Je ne crois pas non plus qu’ils s’abstiendraient de pratiques douteuses autour de la politique nationale, et je ne voudrais pas en faire le partenaire d’un projet important
      Mais il y a une chose que Microsoft fait vraiment bien : des relations B2B fiables et durables
      En tant que client professionnel, je leur fais confiance. Exploiter ce genre de faille détruirait leur réputation
      Je n’utilise pas Google Cloud Platform parce qu’ils plantent souvent leurs clients, mais je fais confiance à AWS et Azure parce qu’ils ne le font pas
      Le coût de payer pour les atteintes au droit d’auteur est probablement bien inférieur au coût de perdre cette confiance
    • Au final, le sens de « tenté de générer du contenu contrefaisant » dépendra non pas de Microsoft, mais de la manière dont le tribunal chargé de faire appliquer cette promesse l’interprétera
      Cela dit, Microsoft aura aussi une motivation plus forte pour faire du lobbying afin que le droit évolue de manière à ce que l’utilisation de ce type d’outils entraîne très peu de responsabilité
    • Ce n’est qu’une formulation juridique disant en substance : « s’il y a violation du droit d’auteur, c’est entièrement votre responsabilité »
      Mais la question de savoir si Microsoft vole le code des gens pour le revendre reste entière
    • C’est une faille assez grande pour y faire passer un camion
    • Je ne trouve pas que ce soit une condition particulièrement surprenante ou restrictive
      Si l’on utilise un LLM pour répondre à des questions sur des documents d’entreprise, il peut générer involontairement du contenu protégé par le droit d’auteur appris lors du préentraînement
  • Ce n’est peut-être pas aussi simple
    Même si Microsoft assume la responsabilité, le contrefacteur peut être poursuivi séparément. Ensuite, Microsoft peut éventuellement prendre en charge les frais de justice
    Mais elle ne peut pas empêcher catégoriquement que les utilisateurs du produit soient poursuivis
    Le passage clé est : « si un tiers poursuit un client commercial pour violation du droit d’auteur en raison de l’utilisation de Microsoft Copilot ou du résultat généré, Microsoft assurera sa défense et paiera tout jugement défavorable ou accord transactionnel, à condition que le client ait utilisé les protections et filtres de contenu intégrés au produit »
    Ici, « assurera sa défense » est important, et signifie probablement que l’utilisateur devra faire appel aux avocats de Microsoft plutôt qu’aux siens
    Comme ils sont en interne, ils peuvent coûter moins cher que des avocats externes facturant à l’heure
    Il y a aussi des conditions sur la manière d’utiliser le produit et, surtout, l’utilisateur doit documenter qu’il l’a utilisé de cette manière
    C’est une évolution intéressante. Les clients entreprises étaient prudents, par crainte de violer accidentellement le droit d’auteur en utilisant ces outils, ce qui a probablement ralenti leur adoption

    • Même des entreprises comme Microsoft confient presque toujours les procès à des cabinets externes
      C’est encore plus vrai pour les affaires où les dommages et intérêts peuvent être élevés
      L’essentiel est de réduire la résistance à l’adoption créée par le risque juridique
  • Cela ne s’applique que si les garde-fous sont activés
    L’un de ces garde-fous consiste à empêcher Copilot de produire du code qui existe dans un dépôt GitHub
    J’ai testé Copilot avec les garde-fous activés, et il était en fait neutralisé au point d’avoir la tête coupée
    À noter que ce n’est pas un changement nouveau. Les Copilot Product Specific Terms comportaient déjà une clause disant que « Microsoft assume la responsabilité en cas de procès » : https://github.com/customer-terms/github-copilot-product-spe...

  • J’ai été beaucoup critiqué dans d’autres communautés à cause de cette réponse, mais si un modèle statistique produit une œuvre purement dérivée en tant que modèle mathématique qui s’apparente fondamentalement à un prédicteur du prochain token optimal, est-ce vraiment du « vol » ?
    Comprendre le prochain token optimal, ou même connaître les tokens les plus fréquents sur GitHub, est-ce du « vol » ?
    On pourrait aussi soutenir que toutes les idées valables ont déjà été trouvées et que tous les textes utiles ont déjà été écrits, donc qu’il faudrait rendre toutes les IA illégales, mais où cela nous mènerait-il ?
    Par exemple, une fonction qui transforme une chaîne de majuscules en minuscules a de fortes chances de ressembler à une fonction écrite par quelqu’un d’autre quelque part sur Terre, et il en va de même pour le code de gestion des erreurs ou les techniques modernes de centrage d’une div

    • Je ne suis pas avocat spécialisé en droit d’auteur, mais même en mettant l’IA de côté, les œuvres dérivées et le fair use relèvent déjà d’une zone grise
      Ce sont des sujets constamment débattus devant les tribunaux
      Si l’on entraînait et publiait un modèle qui, en réponse à l’entrée « When Mr. Bilbo Baggins », produisait l’intégralité de la trilogie du Seigneur des anneaux, il y aurait probablement violation du droit d’auteur
      À l’inverse, s’il génère un paragraphe général sur une « montagne » et un « dragon », sans citation directe ni formulation significative, il y a de fortes chances que cela ne constitue pas en soi une infraction. Ces mots apparaissent dans l’œuvre de Tolkien, mais les mots eux-mêmes ne sont pas protégés par le droit d’auteur
      En revanche, s’il est prouvé que, pour entraîner le modèle, les œuvres de Tolkien ont été copiées d’une manière non autorisée par la licence de droit d’auteur, il pourrait y avoir eu violation du droit d’auteur à une étape intermédiaire, même si la sortie du modèle ne ressemble plus à une copie de l’original
      Je ne pense pas qu’il y ait ici de réponse toute noire ou toute blanche. À partir de quel moment une œuvre protégée par le droit d’auteur, découpée en petits morceaux et transformée en statistiques, cesse-t-elle d’être une œuvre protégée ? Peut-on entraîner un modèle sans d’abord copier quelque chose d’une manière contraire au droit d’auteur ?
      Ce sont des notions humaines souples que des humains, dans les tribunaux et les organes législatifs, doivent trancher, et je ne pense pas que les détails mathématiques changent beaucoup le résultat final
    • Je ne suis pas avocat, mais ce n’est pas du vol
      Mais il n’est pas question ici de vol : il est question de violation du droit d’auteur, ce qui est une notion distincte
      C’est sans doute en partie à cause de cette différence subtile mais fondamentale que les réactions sont froides
    • À propos de l’idée selon laquelle « toutes les idées valables ont déjà été trouvées, donc toutes les IA devraient être illégales », https://en.wikipedia.org/wiki/Copyright dit ceci
      Le droit d’auteur vise à protéger l’expression originale d’une idée sous la forme d’une création, et non l’idée elle-même
    • Le fonctionnement interne n’a pas d’importance
      On pourrait tenir un raisonnement similaire à propos du chiffrement ou des algorithmes de compression
  • Je me demande à quel point ce genre de promesse publique est contraignante
    C’est un peu comme Musk, qui avait récemment déclaré publiquement qu’il prendrait en charge les frais des personnes ayant des problèmes professionnels ou juridiques à cause de propos tenus sur la plateforme, mais refuse désormais d’honorer cette promesse

  • Si une base de code enfreint la GPL, les recours consistent à publier le code source en question ou à cesser la distribution
    Quand Microsoft parle de code tiers, je ne pense pas que l’une ou l’autre de ces options l’inquiète beaucoup
    Je ne sais pas ce que dit la jurisprudence en matière de dommages et intérêts pour les projets open source, mais cela ne semble pas être une préoccupation majeure pour Microsoft
    Autrement dit, le risque à la baisse pour Microsoft est de mobiliser des avocats, et le potentiel à la hausse est l’amélioration de ses outils de génération de code
    Je ne suis pas avocat