10 points par xguru 2023-03-17 | 1 commentaires | Partager sur WhatsApp
  • Projet qui porte llama.cpp en Rust
  • Prend en charge les modèles en version f16 ou quantifiée en 4 bits
  • Utilise directement la bibliothèque de tenseurs ggml comme l’original, avec les mêmes performances

1 commentaires

 
xguru 2023-03-17

Il existe aussi une implémentation de LLaMA en Rust : RLLaMA - Rust+OpenCL+AVX2.

llama.cpp - inférer le modèle LLaMA de Facebook en pur C/C++