LLaMA-Adapter V2 : un outil pour affiner efficacement LLaMA

xguru · 2023-05-03T10:18:01+09:00

Permet d’entraîner LLaMA en modèle de suivi d’instructions et multimodal en seulement 1 heure, avec à peine 1,2 million de paramètres entraînables Alpaca nécessite 7B paramètres, 13G de stockage et 3 heures, tandis que LLaMA-Adapter ne demande que 1,2M paramètres, 4,7M de stockage et 1 heure

(github.com/ZrrSkywalker)

7 points par xguru 2023-05-03 | 1 commentaires | Partager sur WhatsApp

Permet d’entraîner LLaMA en modèle de suivi d’instructions et multimodal en seulement 1 heure, avec à peine 1,2 million de paramètres entraînables
Alpaca nécessite 7B paramètres, 13G de stockage et 3 heures, tandis que
LLaMA-Adapter ne demande que 1,2M paramètres, 4,7M de stockage et 1 heure

1 commentaires

bytebrawlers 2023-05-03

N’utilise-t-il pas une approche PEFT similaire à LoRA, et surtout le point principal n’est-il pas qu’il prend en charge le contexte visuel ? Il existe déjà tellement d’approches SFT (Instruction Fine-Tuning) fondées sur PEFT pour LLaMA...

LLaMA-Adapter V2 : un outil pour affiner efficacement LLaMA

À lire aussi

1 commentaires