nano-llama31 - version Llama 3.1 dans le style de nanoGPT
(github.com/karpathy)- Version de Llama 3.1 dans le style de nanoGPT implémentée par Andrej Karpathy
- Implémentation minimale de l’architecture Llama 3.1, sans dépendances, permettant très simplement l’entraînement, le fine-tuning et l’inférence
- Moins de dépendances et un code plus compact que les implémentations de Meta et HuggingFace
- Se concentre actuellement sur le modèle de base 8B de Llama 3.1
- WIP : encore en cours de développement et pas encore finalisé
Aucun commentaire pour le moment.