Le responsable de l’IA chez Microsoft affirme qu’« il est possible de voler tout le contenu du web ouvert »
(theverge.com)- Mustafa Suleyman, responsable de l’IA chez Microsoft, semble croire à tort que tout le contenu disponible sur le web public est du « freeware » et que n’importe qui peut donc le copier et l’utiliser librement
- Dans une interview accordée à CNBC, il a répondu ainsi à la question : « Les entreprises d’IA ont-elles volé la propriété intellectuelle du monde entier ? »
« Pour ce qui est du contenu déjà présent sur le web ouvert, depuis les années 1990, le contrat social autour de ce contenu était le “fair use”. Tout le monde pouvait le copier, le recréer, le reproduire. Autrement dit, cela a été compris comme une forme de “freeware”. »
- Il a employé le terme « fair use », mais sa compréhension est erronée
- Aux États-Unis, une œuvre est automatiquement protégée par le droit d’auteur dès le moment de sa création, et le fait de la publier sur le web ne signifie pas que son auteur renonce à ces droits
- Le fair use est accordé par les tribunaux ; il s’agit d’un moyen de défense juridique permettant l’usage partiel d’œuvres protégées par le droit d’auteur, dans les limites où cela ne porte pas préjudice au titulaire des droits
- Microsoft et OpenAI font l’objet de plusieurs poursuites les accusant d’avoir enfreint le droit d’auteur en utilisant des articles en ligne pour entraîner leurs modèles d’IA
- Certaines entreprises d’IA soutiennent que l’utilisation de contenus protégés par le droit d’auteur dans les données d’entraînement relève du fair use, mais rares sont celles qui l’affirment de manière aussi catégorique que Suleyman
- Le fichier
robots.txtest un fichier texte qui peut contenir des instructions demandant de ne pas crawler certains sites web, mais il ne s’agit pas d’un document juridique- Certaines entreprises d’IA l’ignorent et continuent de crawler. OpenAI est également connue pour en faire partie
- Suleyman a ajouté que lorsqu’un site web, un éditeur ou un organisme de presse indique explicitement « ne me crawlez pas ou ne scrapez pas mon contenu à d’autres fins que l’indexation », on entre alors dans une zone grise sur le plan juridique, qui sera tranchée devant les tribunaux
1 commentaires
Avec cette logique, Windows mis en ligne sur le web ouvert serait aussi un bien public 🤣