Pirater les modèles d’IA en langage naturel
(arxiv.org)-
Selon un article coécrit par Google, Harvard, Stanford, OpenAI et Apple, il a été possible d’extraire des données précises utilisées pendant l’entraînement simplement en interrogeant de grands modèles de langage.
-
Une attaque menée contre GPT-2 a permis d’extraire avec une très grande précision des titres d’actualité et des informations personnelles comme des adresses postales.
-
Ce type d’attaque ne concerne pas seulement GPT-2 : d’autres modèles de langage peuvent aussi y être vulnérables, d’où la nécessité d’accorder davantage d’attention au prétraitement des données d’entraînement.
Aucun commentaire pour le moment.