nano-llama31 - version Llama 3.1 dans le style de nanoGPT

xguru · 2024-08-08T10:02:02+09:00

Version de Llama 3.1 dans le style de nanoGPT implémentée par Andrej Karpathy Implémentation minimale de l’architecture Llama 3.1, sans dépendances, permettant très simplement l’entraînement, le fine-tuning et l’inférence Moins de dépendances et un code plus compact que les implémentations de Meta et HuggingFace Se concentre actuellement sur le modèle de base 8B de Llama 3.1 WIP : encore en cours de développement et pas encore finalisé

(github.com/karpathy)

9 points par xguru 2024-08-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Version de Llama 3.1 dans le style de nanoGPT implémentée par Andrej Karpathy
Implémentation minimale de l’architecture Llama 3.1, sans dépendances, permettant très simplement l’entraînement, le fine-tuning et l’inférence
- Moins de dépendances et un code plus compact que les implémentations de Meta et HuggingFace
Se concentre actuellement sur le modèle de base 8B de Llama 3.1
WIP : encore en cours de développement et pas encore finalisé

nano-llama31 - version Llama 3.1 dans le style de nanoGPT

À lire aussi

Aucun commentaire pour le moment.