De nombreux groupes de sécurité de l’IA tentent actuellement de criminaliser l’IA open source existante

(1a3orn.com)

5 points par GN⁺ 2024-01-17 | 3 commentaires | Partager sur WhatsApp

Des utilisateurs de LLM se sont plaints que des groupes de sécurité de l’IA cherchaient à interdire les LLM open source qu’ils utilisent, mais certains ont affirmé qu’il s’agissait d’une rumeur infondée
Or, cette affirmation est fausse. En réalité, de nombreux groupes de sécurité de l’IA ont soutenu des « projets de loi qui criminaliseraient l’open sourcing des modèles existants »
Certaines de ces organisations disposent de financements importants et sont de plus en plus connectées aux décideurs politiques

Propositions législatives des groupes de sécurité de l’IA

Center for AI Safety : organisation bien financée axée sur la recherche et le plaidoyer en matière de sécurité de l’IA, qui a proposé à la NTIA un cadre réglementaire définissant les « systèmes d’IA puissants » et imposant des exigences revenant de fait à interdire leur publication en open source.
Center for AI Policy : groupe de lobbying basé à Washington D.C., dont les règles initialement proposées auraient soumis Llama-2, déjà publié, à la régulation d’une nouvelle agence.
Palisade Research : organisation à but non lucratif visant à démontrer concrètement des capacités dangereuses afin de conseiller les responsables politiques et le grand public sur les risques de l’IA, qui a appelé le gouvernement à suspendre la sortie de Llama 2.
The Future Society : think tank ayant pour objectif d’aligner l’IA sur une meilleure gouvernance, qui a proposé des exigences strictes pour les GPAI de « type 2 » et a explicitement indiqué que les modèles open source ne pouvaient pas les satisfaire.

Influence des groupes de sécurité de l’IA

Ces organisations ne représentent qu’une partie de celles qui ont exprimé leurs politiques ou leurs objectifs de manière très claire.
D’autres groupes, aux positions moins explicites, existent également et finissent eux aussi par adopter une posture opposée à l’open sourcing.
Si les groupes de sécurité de l’IA avaient réussi à faire adopter les lois qu’ils souhaitaient par le passé, ils auraient interdit des modèles aujourd’hui largement utilisés.
Ces organisations espèrent toujours faire adopter des mesures similaires, tandis que le mouvement de l’IA open source reste en retard sur le plan législatif par rapport à elles.

Avis de GN⁺

Les propositions des groupes de sécurité de l’IA risquent de limiter le développement de l’IA open source et de renforcer les monopoles des entreprises.
L’IA open source est essentielle à la recherche et à l’innovation, et la restreindre pourrait avoir un impact négatif sur le progrès technologique.
Cet article montre que des restrictions juridiques sur l’IA open source sont actuellement en cours, un sujet susceptible d’avoir des effets importants sur la démocratisation et l’accessibilité des technologies d’IA.

3 commentaires

2024-01-17

[Ce commentaire a été masqué.]

kuroneko 2024-01-17

J’ai l’impression qu’on vit ça à chaque fois qu’une nouvelle technologie arrive.

GN⁺ 2024-01-17

Commentaire Hacker News

Les experts de la sécurité de l’IA sont critiqués comme étant hypocrites. S’ils mettaient réellement en pratique ce qu’ils prônent, ils demanderaient l’interdiction de toute IA. Les effets nuisibles de l’IA existent déjà, que les poids soient publics ou non, et l’un de ses usages les plus rentables est notamment de dissimuler le plagiat et de spammer Internet avec le même texte reformulé techniquement avec d’autres mots.
Une autre raison pour laquelle la fin de l’IA open source pourrait approcher est que, si les données d’entraînement deviennent soumises à licence, ce sera terminé. Beaucoup de gens sont en colère contre OpenAI et Midjourney à cause de ce dont l’IA open source a besoin pour survivre, à savoir le fine-tuning ou l’entraînement depuis zéro. Dès que des responsables politiques en feront un sujet de plateforme, les lois seront probablement réécrites pour empêcher les entreprises d’utiliser librement les données d’entraînement.
Il existe plusieurs formes de sécurité. Par exemple, la protection des intérêts est aussi une forme de sécurité. Beaucoup d’organisations ressemblent à des lobbyistes pour les entreprises déjà établies dans le secteur de l’IA. Il semble que les efforts de Microsoft pour faire appliquer ses licences aient déjà utilisé ce type de stratégie.
Le terme de sécurité de l’IA n’aide pas, car il regroupe plusieurs idées différentes. Par exemple, des sorties politiquement correctes « sûres », l’absence de porno, la manipulation sociale/électorale à grande échelle, ou encore l’extinction de l’humanité par une IA puissante ; ces trois sujets n’ont presque rien en commun, ce qui rend tout débat inefficace.
Le gouvernement sait que la capacité du grand public à utiliser « l’IA » sans son contrôle ni sa supervision réduit l’expansion de son pouvoir. Comme le montre l’article, ces « think tanks » préparent déjà le terrain pour empêcher une répétition de Llama 2. Il nous faudrait un Stallman de l’IA, et les modèles d’IA FOSS devraient devenir l’équivalent du mouvement mené pour FOSS UNIX dans les années 80 et 90. Pourtant, lorsque je lui ai écrit sur ce sujet, Stallman s’est montré soit peu intéressé, soit défaitiste, ignorant largement l’idée d’une GPL pour les poids des modèles.
La plupart des experts de la sécurité de l’IA semblent croire fermement à ce qu’ils prêchent. Qu’ils aient raison est une tout autre question. Mais le financement de la sécurité de l’IA est clairement motivé en partie par la capture réglementaire ou une forme de protectionnisme.
Ne sous-estimez pas la volonté des systèmes de contrôle ou de pouvoir existants de se reproduire eux-mêmes.
Il existe de nombreux chercheurs en sécurité de l’IA de bonne foi, mais on voit aussi une hypocrisie sécuritaire qui révèle un double standard du type « l’IA pour moi, mais pas pour toi ».
Les licences sur les données deviendront un gros goulot d’étranglement.
Les résultats non censurés seront utilisés à charge contre les modèles open source, dans des zones sombres ou grises.
L’écart en capacité de calcul et en taille de modèle entre les modèles open source et fermés est important. 7B correspond à l’open source, tandis que les modèles fermés seront bien plus grands.
Le fait que ces organisations définissent des seuils de FLOP et prennent MMLU comme métrique d’évaluation pertinente est assez ridicule. On dirait que plusieurs organisations ont copié-collé des seuils similaires. À mesure que le coût du calcul baisse, ces seuils deviendront eux aussi de moins en moins élevés en pratique. Nous regarderons peut-être cela rétrospectivement comme quelque chose d’étroit d’esprit et de très court-termiste.