Pirater les modèles d’IA en langage naturel

budlebee · 2021-03-14T11:00:03+09:00

Selon un article coécrit par Google, Harvard, Stanford, OpenAI et Apple, il a été possible d’extraire des données précises utilisées pendant l’entraînement simplement en interrogeant de grands modèles de langage. Une attaque menée contre GPT-2 a permis d’extraire avec une très grande précision des titres d’actualité et des informations personnelles comme des adresses postales. Ce type d’attaque ne concerne pas seulement GPT-2 : d’autres modèles de langage peuvent aussi y être vulnérables, d’où la nécessité d’accorder davantage d’attention au prétraitement des données d’entraînement.

(arxiv.org)

12 points par budlebee 2021-03-14 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Selon un article coécrit par Google, Harvard, Stanford, OpenAI et Apple, il a été possible d’extraire des données précises utilisées pendant l’entraînement simplement en interrogeant de grands modèles de langage.
Une attaque menée contre GPT-2 a permis d’extraire avec une très grande précision des titres d’actualité et des informations personnelles comme des adresses postales.
Ce type d’attaque ne concerne pas seulement GPT-2 : d’autres modèles de langage peuvent aussi y être vulnérables, d’où la nécessité d’accorder davantage d’attention au prétraitement des données d’entraînement.

Pirater les modèles d’IA en langage naturel

À lire aussi

Aucun commentaire pour le moment.