Web LLM - prise en charge de Llama2 7B/13B
(webllm.mlc.ai)- Un service qui exécute dans le navigateur, sans serveur, des LLM comme Llama, RedPajama et Vicuna en WASM
- Début de la prise en charge de Llama 2 7B/13B
- Llama 2 70B est également pris en charge, mais son utilisation n’est possible que sur les Mac Apple Silicon avec au moins 64 Go de RAM
- Accélération via WebGPU
7 commentaires
C’est une 750Ti, donc....
Il arrive souvent que ce qui sort en sortie d’URL se casse aussi dans ChatGPT. J’imagine que c’est inévitable.
J’ai trouvé ça vraiment fascinant de voir Stable Diffiusion s’exécuter sur le web,
mais est-ce que WebGPU pourra vraiment parvenir à une grande unification des API GPU ?
C'est incroyable.
Web LLM - Exécuter des LLM accélérés par WebGPU dans le navigateur, avec prise en charge de Llama2 7B/13B