- Article présentant une nouvelle méthode pour améliorer la mémoire à long terme des grands modèles de langage (LLM) utilisés dans les systèmes de dialogue ouverts
- Problème majeur des systèmes de dialogue ouverts : ils oublient les informations importantes dans les conversations de longue durée
- Les solutions existantes consistent à entraîner un récupérateur ou un résumeur spécifique afin d’extraire les informations essentielles des conversations, mais cela prend beaucoup de temps et dépend fortement de la qualité des données annotées
- La méthode proposée cherche à atténuer ce problème en utilisant des LLM pour générer récursivement des résumés ou des souvenirs
- Cette méthode commence par faire mémoriser aux LLM de petits contextes de conversation, puis génère récursivement de nouveaux souvenirs à partir des souvenirs précédents et des contextes suivants
- Avec l’aide du souvenir le plus récent, le LLM peut produire des réponses très cohérentes
- La méthode a été évaluée avec ChatGPT et text-davinci-003, et les résultats expérimentaux sur des jeux de données publics largement utilisés montrent qu’elle permet de produire des réponses plus cohérentes dans des dialogues à long contexte
- Cette méthode constitue une solution potentielle pour permettre aux LLM de modéliser des contextes extrêmement longs
- Le code et les scripts de cette méthode seront publiés ultérieurement
- Cette recherche a bénéficié du soutien de la Simons Foundation, des institutions membres et de tous les contributeurs
1 commentaires
Commentaires Hacker News