5 points par GN⁺ 2024-05-10 | 1 commentaires | Partager sur WhatsApp

Réaction négative des utilisateurs à l’annonce du partenariat entre Stack Overflow et OpenAI

  • Certains utilisateurs réagissent négativement à l’annonce récente du partenariat entre Stack Overflow et OpenAI
  • Certains ont tenté de supprimer leur propre contenu (questions et réponses) de Stack Overflow, mais ont rencontré des difficultés car le site ne permet pas de le faire facilement
  • En conséquence, ces utilisateurs ont décidé de modifier leurs questions ou réponses pour les « dégrader » afin de protester contre la collaboration entre Stack Overflow et OpenAI

Aperçu du partenariat entre Stack Overflow et OpenAI

  • Stack Overflow et OpenAI ont décidé de collaborer via un nouveau partenariat autour d’une API
  • Cette collaboration vise à combiner la vaste plateforme de connaissances de Stack Overflow avec les modèles d’IA avancés d’OpenAI pour les proposer aux développeurs
  • Les utilisateurs d’OpenAI pourront exploiter les données précises et vérifiées de Stack Overflow via l’accès à OverflowAPI, afin de résoudre leurs problèmes plus rapidement et de se concentrer sur les tâches prioritaires
  • OpenAI prévoit également d’intégrer à ChatGPT les connaissances techniques vérifiées de Stack Overflow afin d’améliorer l’accès des utilisateurs à des informations et du code fiables

Rejet de l’IA

  • Les sites Stack Overflow et plus largement Stack Exchange sont des outils très utiles pour la communauté, mais certains utilisateurs sont loin d’être ravis que leur contenu soit utilisé pour l’entraînement de l’IA et serve à produire des réponses sans attribution de source
  • Il s’agit d’une réaction aujourd’hui fréquente chez les créateurs de contenu, non seulement sur Stack Overflow mais dans l’ensemble d’Internet
  • Internet traverse actuellement une période de changement, marquée par la baisse du trafic des blogs et des pages vues, la hausse des recherches de réponses via l’IA, et la diminution de l’usage des moteurs de recherche chez certaines personnes
  • Nous sommes dans une période de tension, entre l’adaptation aux nouvelles capacités de ChatGPT et d’autres LLM (grands modèles de langage), et l’incertitude sur ce que tout cela signifie pour l’Internet tel que nous le connaissons
  • La récente réaction contre le partenariat Stack Overflow–OpenAI n’est qu’un exemple parmi d’autres de la manière dont certaines personnes réagissent négativement à l’adoption massive de l’IA et aux changements rapides qu’elle entraîne

Stack Overflow bloque-t-il des comptes à cause de la suppression de contenu ?

  • Plusieurs utilisateurs ont publié sur Twitter et Hacker News qu’après avoir tenté de supprimer plusieurs questions et réponses qu’ils avaient auparavant publiées sur Stack Overflow, ils avaient reçu un e-mail de modérateurs de Stack Overflow indiquant que leur compte était suspendu pendant 7 jours ou temporairement bloqué
  • Selon l’e-mail de l’équipe de modération de Stack Overflow, supprimer ou retirer du contenu pouvant être utile à d’autres personnes peut perturber l’ensemble de la communauté, même si ce contenu n’est plus utile à son auteur
  • L’activité de Stack Overflow et l’ensemble du réseau Stack Exchange reposent sur le contenu généré par les utilisateurs pour que les sites restent utiles ; il existe donc des raisons commerciales évidentes pour lesquelles l’entreprise ne souhaite pas voir les utilisateurs retirer massivement leur contenu
  • Le fait que Stack Overflow suspende des comptes et envoie des e-mails d’avertissement n’est probablement pas nouveau. La plateforme applique vraisemblablement ces politiques depuis longtemps pour se protéger
  • Si les utilisateurs pouvaient facilement dégrader ou supprimer de grandes quantités de contenu, cela pourrait provoquer une perturbation importante de la plateforme ; protéger ce contenu est donc dans l’intérêt de Stack Overflow et de la communauté
  • Il est également probable qu’il s’agisse d’e-mails automatisés déclenchés par le comportement des utilisateurs, et contacter directement Stack Overflow au sujet du contenu pourrait être une bonne démarche
  • Jusqu’à présent, aucune réponse de Stack Overflow concernant ces suspensions de compte n’a été vue. Il n’est pas non plus clair combien d’utilisateurs tentent réellement cela, si bien qu’il n’y a peut-être pas de forte réaction contre le partenariat entre Stack Overflow et OpenAI
  • Comme l’élan en faveur de l’adoption de l’IA ne devrait pas ralentir de sitôt, il sera intéressant d’observer comment tout cela évoluera à l’avenir
  • Il n’est pas recommandé aux autres utilisateurs de Stack Overflow de supprimer leur contenu en signe de protestation

L’avis de GN⁺

  • Le partenariat entre Stack Overflow et OpenAI devrait avoir un impact important sur le développement des technologies d’IA et sur la communauté des développeurs. Mais la question de l’équilibre entre la protection de la propriété intellectuelle des développeurs individuels et l’utilisation de leurs contenus comme données d’entraînement pour l’IA reste à résoudre
  • Les développeurs doivent pouvoir partager leurs connaissances tout en recevant une compensation juste en retour. Stack Overflow semble devoir mettre en place un système de rémunération approprié à cette fin
  • Pour encourager les développeurs à partager volontairement leurs connaissances, la confiance envers la communauté est essentielle. Une approche prudente semble nécessaire afin que cet épisode n’érode pas la confiance des développeurs envers Stack Overflow
  • En parallèle, l’amélioration de la productivité du développement grâce à des technologies d’IA comme ChatGPT constitue aussi un avantage majeur pour les développeurs. Il faudra chercher des moyens de maximiser ces bénéfices tout en minimisant les effets secondaires de l’usage de l’IA, comme les enjeux de protection de la vie privée
  • Un débat similaire a déjà eu lieu autour de GitHub Copilot et des controverses sur le droit d’auteur. Il semble nécessaire de poursuivre des discussions actives au sein de la communauté des développeurs pour parvenir à un terrain d’entente acceptable pour tous

1 commentaires

 
GN⁺ 2024-05-10
Réactions sur Hacker News
  • Problème de changement de licence du contenu utilisateur sur StackOverflow :
    • Il y a environ 5 ans, StackOverflow a déclaré à tort que tout le contenu soumis par les utilisateurs était publié sous CC-BY-SA 4.0. L’accord utilisateur d’origine était en fait en CC-BY-SA 3.0.
    • Entre mi-2018 et début 2019, il y a eu de la confusion sur les licences applicables au code et au contenu non lié au code.
    • Début 2019, les utilisateurs ont été invités à se reconnecter et à accepter un nouvel accord de licence.
    • Actuellement, le contenu antérieur au 5 mai 2018 relève de CC-BY-SA 3.0, et le contenu postérieur de CC-BY-SA 4.0.
  • Avis des utilisateurs sur les scrapers IA de StackOverflow et la fourniture de contenu à OpenAI :
    • Certains utilisateurs n’ont aucun problème avec le fait que leurs réponses soient utilisées pour l’entraînement d’IA. Ils estiment que cela apporte une grande valeur à des outils comme ChatGPT.
    • Le partenariat avec OpenAI n’est pas au cœur du problème des suppressions de contenu utilisateur. En matière de licence, la suppression de contenu n’a jamais été bien vue et est généralement annulée.
    • À cause de la licence CC-BY-SA, même si StackOverflow ne l’autorisait pas, d’autres peuvent copier le contenu, ce qui rend sa suppression difficile.
    • Les utilisateurs peuvent supprimer leur nom ou modifier des informations personnelles, mais ils ne peuvent pas retirer plus tard un contenu de qualité en tant que tel.
  • Le problème de la gestion d’un produit « gratuit » par une entreprise à but lucratif :
    • Comme elle doit générer des revenus, elle n’est pas liée à l’éthique de l’open source. Les utilisateurs pensent contribuer à l’open source, alors que ce n’est pas le cas en réalité.
    • Les agissements de StackExchange sont probablement légaux, mais les contributeurs ne sont pas des parties prenantes, et il suffit de conserver un volume de contributeurs commercialement soutenable.
    • Dans le cas d’un produit fourni gratuitement, l’utilisateur finit par devenir le produit, et si l’on ne sait pas comment il est monétisé, on finira un jour par être déçu.
  • Nécessité de nouvelles licences de contenu spécifiquement adaptées à l’entraînement de l’IA :
    • Il pourrait apparaître des licences dans l’esprit de la GPL, par exemple en imposant la publication des poids d’IA lorsque le contenu a été utilisé pour un entraînement d’IA commercial.
  • Le modèle de vente de jeux de données de StackOverflow :
    • Dès le départ, StackOverflow s’est surtout concentré sur la constitution d’un jeu de données pour le SEO plutôt que sur une approche centrée sur les utilisateurs. L’accord avec OpenAI n’a pas changé grand-chose au fond.
    • Avec l’arrivée des LLM, la crise de StackOverflow est inévitable, donc autant vendre à OpenAI ce qu’il y a à vendre avant l’effondrement.
  • Importance de la clause ShareAlike de la licence CC BY-SA :
    • La clause imposant de distribuer les œuvres dérivées sous la même licence est très vaste et ambiguë. La définition de « build upon » peut ne pas sembler attrayante pour beaucoup d’utilisateurs.
  • Comparaison des avantages et inconvénients entre les LLM et StackOverflow :
    • Grâce aux LLM, il est devenu possible d’éviter autant que possible StackOverflow. StackOverflow est rempli d’élitisme et d’une forme de toxicité qui privilégie la procédure plutôt que l’aide concrète.
    • Certains se plaignent que les LLM donnent parfois de mauvaises réponses, mais beaucoup de réponses sur StackOverflow sont elles aussi totalement erronées ou hors sujet. Il y a aussi de nombreuses réponses obsolètes.
    • L’idéal serait de combiner la capacité rédactionnelle des LLM avec la validation par les utilisateurs de StackOverflow. Ce ne serait pas idéal pour ceux qui cherchent seulement à accumuler des points sur Internet, mais ce serait excellent pour les utilisateurs.
  • Message d’avertissement automatique de StackOverflow en cas de suppression massive de contenu :
    • Il semble exister au moins depuis 2017, et il s’affiche automatiquement lorsqu’une suppression massive est détectée.
    • Comme StackOverflow a un aspect plus proche d’un wiki que d’un forum, on peut comprendre la raison d’une telle politique. Cela ne semble pas avoir été introduit pour étouffer les protestations contre OpenAI.
  • Certains disent aussi, à titre personnel, qu’ils n’ont quasiment pas utilisé StackOverflow au cours des deux dernières années.