Web LLM - Exécuter des LLM accélérés dans le navigateur avec WebGPU

xguru · 2023-04-18T10:17:01+09:00

Exécute dans le navigateur, sans serveur, des LLM comme LLaMA et Vicuna à l’aide de WASM Accéléré par WebGPU, mais prend aussi en charge séparément les backends GPU pris en charge par Apache TVM (CUDA, OpenCL, Vulkan) Utilise la technologie MLC (Machine Learning Compilation)

(github.com/mlc-ai)

14 points par xguru 2023-04-18 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Exécute dans le navigateur, sans serveur, des LLM comme LLaMA et Vicuna à l’aide de WASM
Accéléré par WebGPU, mais prend aussi en charge séparément les backends GPU pris en charge par Apache TVM (CUDA, OpenCL, Vulkan)
Utilise la technologie MLC (Machine Learning Compilation)

Web LLM - Exécuter des LLM accélérés dans le navigateur avec WebGPU

À lire aussi

Aucun commentaire pour le moment.