OpenLLaMA - la réplique ouverte de LLaMA

xguru · 2023-05-05T10:16:01+09:00

Une réplique de LLaMA publiée sous licence Apache afin de permettre des usages variés Exploite le jeu de données RedPajama publié par Together Entraîné via EasyLM, un pipeline basé sur JAX Publication d’OpenLLaMA 7B basé sur 200B/300B tokens

(github.com/openlm-research)

20 points par xguru 2023-05-05 | 1 commentaires | Partager sur WhatsApp

Une réplique de LLaMA publiée sous licence Apache afin de permettre des usages variés
Exploite le jeu de données RedPajama publié par Together
Entraîné via EasyLM, un pipeline basé sur JAX
Publication d’OpenLLaMA 7B basé sur 200B/300B tokens

1 commentaires

xguru 2023-05-05

Quelqu’un a posté dans les commentaires HN la commande « utiliser OpenLLaMA avec llama.cpp + 8 Go de RAM ».
https://news.ycombinator.com/item?id=35798888

  git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && cmake -B build && cmake --build build  
  python3 -m pip install -r requirements.txt  
  
  cd models && git clone https://huggingface.co/openlm-research/open_llama_7b_preview_200bt/ && cd -  
  python3 convert-pth-to-ggml.py models/open_llama_7b_preview_200bt/open_llama_7b_preview_200bt_transformers_weights 1  
  ./build/bin/quantize models/open_llama_7b_preview_200bt/open_llama_7b_preview_200bt_transformers_weights/ggml-model-f16.bin models/open_llama_7b_preview_200bt_q5_0.ggml q5_0  
  ./build/bin/main -m models/open_llama_7b_preview_200bt_q5_0.ggml --ignore-eos -n 1280 -p "Building a website can be done in 10 simple steps:" --mlock

OpenLLaMA - la réplique ouverte de LLaMA

À lire aussi

1 commentaires