- Mark Zuckerberg, PDG de Facebook, affirme que le grand modèle de langage Llama 3 de Meta est open source, mais en réalité il ne l’est pas
- Selon la définition de l’open source de l’Open Source Initiative (OSI), la licence de Llama 3 ne remplit pas les critères de l’open source sur plusieurs points
- Meta n’est pas la seule entreprise à recourir à cette tromperie. On appelle cela l’« open washing »
- L’open washing est une pratique trompeuse qui consiste à présenter un produit ou un service comme « ouvert » alors qu’il ne l’est pas réellement
- Le terme a été créé en 2009 par Michelle Thorne, chercheuse en politique de l’Internet, en s’inspirant du « greenwashing »
- Dans le domaine de l’IA, l’open washing est omniprésent. Parmi les 45 modèles étudiés par des chercheurs de la Radboud University, ceux des grands groupes comme Google, Meta et Microsoft ne sont pas réellement open source
Pourquoi les entreprises font de l’open washing
- Autrefois, les entreprises se méfiaient de l’open source, mais aujourd’hui sa perception est devenue positive
- En 2001, Steve Ballmer déclarait que « Linux est un cancer », en affirmant que l’utilisation de logiciels open source imposait de rendre le reste des logiciels open source eux aussi
- Les entreprises exploitent l’image positive de l’open source tout en refusant de s’y engager réellement
- Cela les aide à améliorer leur image publique et à séduire des consommateurs sensibles à la transparence et à l’ouverture
- Certaines entreprises utilisent l’open washing pour protéger leurs modèles et leurs pratiques de l’examen scientifique et réglementaire, tout en profitant des bénéfices de l’étiquette « ouverte »
- L’AI Act européen accorde des exemptions spécifiques aux modèles « open source », ce qui constitue une forte incitation à l’open washing
L’absence d’une définition claire de l’IA open source
- L’UE n’a pas encore arrêté de définition claire de l’IA open source, et en réalité personne ne l’a encore fait
- L’OSI prévoit de publier sa définition de l’IA open source dans les prochains jours
- Les licences actuelles relevant de l’open washing ne correspondent, en dehors de leurs créateurs, à la définition de personne
- Mais toutes les grandes entreprises de l’IA ne mentent pas sur l’open source
- Par exemple, le LLM Granite 3.0 d’IBM est réellement proposé en open source sous licence Apache 2
- Même si l’OSI n’est ni un gouvernement ni un régulateur, pourquoi est-il important d’utiliser correctement le terme open source ?
- L’OSI n’est qu’une organisation à but non lucratif qui a élaboré des lignes directrices utiles
- Dan Lorenc, CEO de Chainguard, a déclaré récemment lors de son discours d’ouverture à la conférence SOSS d’Atlanta :
- Personne ne peut obliger quiconque à utiliser la définition de l’OSI, mais beaucoup de gens, en particulier les juristes, lui font confiance
- Ils font confiance au travail de l’OSI et comprennent les protections dont bénéficient les entreprises lorsqu’elles utilisent des licences conformes aux critères de l’open source
- C’est pour cela que cette définition apparaît dans les contrats d’achat des grandes entreprises partout dans le monde
L’open source n’est pas seulement une question juridique ou commerciale
- L’open source offre aux développeurs une manière de travailler librement
- Sans l’open source, on perdrait l’avantage de pouvoir utiliser librement du code sans devoir connaître ni surveiller en détail les multiples conditions des licences
- S’il fallait vérifier la licence de chaque morceau de code, les développeurs devraient faire valider juridiquement chaque nouvelle bibliothèque avant de l’utiliser
- Les entreprises auraient peur de publier quoi que ce soit sur Internet si les responsabilités liées à la publication du code source restaient floues
- Lorenc souligne que ce n’est pas un problème réservé aux grandes entreprises, mais un problème partagé
- Tous ceux qui utilisent de l’open source seraient concernés
- Des projets entiers pourraient cesser de fonctionner, des failles de sécurité ne seraient pas corrigées et la maintenance deviendrait bien plus difficile
- Il faut agir ensemble pour préserver et défendre la définition de l’open source. Sinon, les juristes reviendront à la charge
- De nombreux avocats spécialisés en propriété intellectuelle ne veulent pas de ce genre de casse-tête
- Une véritable licence open source simplifie la vie des entreprises, des programmeurs et des juristes
- Introduire des clauses du type « ouvert sauf pour ceux qui pourraient nous concurrencer » ou « ouvert sauf pour ceux qui peuvent déployer le code dans le cloud » revient à créer soi-même les problèmes
L’open washing nuit à tout le monde
- Au final, l’open washing va polluer le travail juridique, commercial et de développement de tout le monde
- Ironiquement, même les entreprises court-termistes qui soutiennent aujourd’hui cette approche en subiront les conséquences
- Car au bout du compte, presque tout leur travail, en particulier dans l’IA, repose sur l’open source
L’avis de GN⁺
- Les pratiques d’open washing qui dégradent la définition de l’open source peuvent avoir des effets négatifs non seulement dans l’IA, mais aussi sur l’ensemble de l’industrie du logiciel. Elles limitent la liberté d’action des développeurs et augmentent les risques juridiques pour les entreprises
- Le fait pour les entreprises de ne chercher qu’à exploiter l’image positive de l’open source est une attitude à courte vue. À long terme, cela peut finir par leur nuire à elles aussi
- Pour faire progresser les technologies d’IA, une coopération et un partage fondés sur l’esprit de l’open source sont indispensables. Les entreprises devraient prendre la tête de la construction d’une véritable culture open source
- Il est urgent d’établir une définition et des critères clairs pour l’IA open source. La définition de l’IA open source par l’OSI devrait être publiée prochainement ; entreprises, pouvoirs publics et communauté des développeurs devront ensuite coopérer sur cette base
- Des actions de sensibilisation auprès des consommateurs et des développeurs sont également nécessaires pour prévenir l’open washing. Il est important de ne pas accepter aveuglément les affirmations d’« ouverture » des entreprises et de vérifier attentivement les licences et les pratiques réelles
2 commentaires
On voit souvent des projets publiés en open source pour confier à la communauté les corrections de bugs initiaux et l’amélioration des fonctionnalités, puis, une fois le produit stabilisé, être discrètement retirés sous licence propriétaire.
Certains disent qu’il suffit de forker, mais au final l’entreprise récupère simplement à son compte l’image déjà installée et la valeur du nom.
Avis Hacker News
Lorsqu’il faut choisir entre deux programmes ou modèles d’IA, un débat apparaît entre ceux qui préfèrent l’open source et ceux qui ne le privilégient pas. L’objectif est donc de faire paraître open source même les programmes qui ne le sont pas.
L’open source était un compromis favorable aux entreprises, mais certains participants portaient une forte exigence morale. Ce sont justement ces personnes qui doivent empêcher les abus de l’open source.
Si cela ne peut pas être résolu par les marques, les certifications ou les licences, alors il faut faire passer le message via les médias grand public. <i>The Register</i> dispose d’une connaissance interne du sujet, mais cela doit être largement porté à la connaissance du public.
De nombreuses entreprises critiquent l’open source tout en faisant tourner leur activité grâce à des logiciels open source comme Linux, Java ou Debian. La plupart ne se sentent pas obligées de contribuer ou d’apporter un soutien.
L’OSI prépare une définition de l’open source appliquée à l’IA, qui fait polémique.
thirdweb est techniquement open source, mais ne fonctionne pas sans clé API, et vérifie les limites d’appels API sur son SaaS. Cela décourage les équipes qui veulent créer une véritable alternative open source.
L’incapacité à populariser des concepts comme le fair source a eu pour conséquence que les petites entreprises non-SaaS ne peuvent pas survivre en open source.
L’open source ne porte ni l’éthique ni la philosophie du logiciel libre. Le logiciel libre est supérieur à l’open source.
Pour les grands modèles, le coût d’entraînement est élevé, les artefacts binaires ont de la valeur et peuvent être modifiés. Si l’OSI parvient à établir une définition, l’effort méritera d’être salué, que Meta s’y conforme ou non.
L’OSI doit reconnaître qu’à l’ère des grands fournisseurs cloud, une protection contre les acteurs du marché est nécessaire. Il faut des options de licence claires pour éviter des drames comme ceux de Mongo, Elastic et Redis.
L’expression "Open <something>" doit être protégée pour ne pas induire le public en erreur. Il faut éviter des confusions comme "OpenAI".
Il est pire de retirer une licence après avoir accepté les contributions de la communauté que de mal utiliser le terme "Open Source". Cela devrait être considéré comme une fraude et engager la responsabilité civile.
Pour les modèles d’IA, si les scripts d’entraînement reproductibles et les données ne sont pas partagés, l’appellation "Open Weights" est plus appropriée.