7 points par xguru 2023-05-03 | 1 commentaires | Partager sur WhatsApp
  • Permet d’entraîner LLaMA en modèle de suivi d’instructions et multimodal en seulement 1 heure, avec à peine 1,2 million de paramètres entraînables
  • Alpaca nécessite 7B paramètres, 13G de stockage et 3 heures, tandis que
    LLaMA-Adapter ne demande que 1,2M paramètres, 4,7M de stockage et 1 heure

1 commentaires

 
bytebrawlers 2023-05-03

N’utilise-t-il pas une approche PEFT similaire à LoRA, et surtout le point principal n’est-il pas qu’il prend en charge le contexte visuel ? Il existe déjà tellement d’approches SFT (Instruction Fine-Tuning) fondées sur PEFT pour LLaMA...