14 points par xguru 2023-04-18 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Exécute dans le navigateur, sans serveur, des LLM comme LLaMA et Vicuna à l’aide de WASM
  • Accéléré par WebGPU, mais prend aussi en charge séparément les backends GPU pris en charge par Apache TVM (CUDA, OpenCL, Vulkan)
  • Utilise la technologie MLC (Machine Learning Compilation)

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.