-
Les LLM oublient-ils vraiment ?
- Les grands modèles de langage (LLM) sont entraînés sur d’immenses volumes de données textuelles et affichent d’excellentes capacités de génération de texte
- Cependant, en raison de la nature sensible des données d’entraînement, ils peuvent apprendre des comportements indésirables
- Le « machine unlearning » est une méthode visant à résoudre ce problème, avec pour objectif de supprimer des connaissances spécifiques tout en préservant au maximum l’utilité du modèle
-
Problème et contenu de la recherche
- Il existe encore peu de travaux sur la question de savoir si les méthodes actuelles d’« oubli » font réellement oublier des connaissances ou si elles ne font que les masquer
- Cette étude montre que l’application de la quantification peut permettre de récupérer des informations « oubliées »
- Des expériences ont été menées à plusieurs niveaux de précision à l’aide de diverses techniques de quantification
-
Résultats expérimentaux
- Pour les méthodes d’« oubli » assorties de contraintes d’utilité, le modèle conserve en moyenne 21 % des connaissances censées être oubliées en pleine précision
- Après une quantification en 4 bits, ce taux augmente à 83 %
-
Stratégie proposée
- L’étude fournit une explication théorique de ce phénomène
- Elle propose une stratégie d’« oubli » robuste à la quantification afin d’atténuer ce problème complexe
-
Importance de la recherche
- Ce travail constitue une contribution importante à l’évaluation et à l’amélioration de l’efficacité des méthodes d’« oubli » pour les LLM
- Il aide à comprendre l’impact de la quantification sur l’« oubli »
1 commentaires
Commentaires Hacker News