MiniLLM - Exécuter des LLM sur un GPU personnel

xguru · 2023-03-30T10:45:01+09:00

Un système minimal pour exécuter les derniers LLM sur des GPU Nvidia grand public Prend en charge plusieurs LLM (LLAMA, BLOOM, OPT) jusqu'à 170B de paramètres Compatible avec différents types de GPU Nvidia Petit code Python facile à utiliser Utilise en interne l'algorithme GPTQ pour la compression en 3 bits afin de minimiser l'utilisation de la mémoire GPU

(github.com/kuleshov)

22 points par xguru 2023-03-30 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Un système minimal pour exécuter les derniers LLM sur des GPU Nvidia grand public
Prend en charge plusieurs LLM (LLAMA, BLOOM, OPT) jusqu'à 170B de paramètres
Compatible avec différents types de GPU Nvidia
Petit code Python facile à utiliser
Utilise en interne l'algorithme GPTQ pour la compression en 3 bits afin de minimiser l'utilisation de la mémoire GPU

MiniLLM - Exécuter des LLM sur un GPU personnel

À lire aussi

Aucun commentaire pour le moment.