9 points par xguru 2024-08-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Version de Llama 3.1 dans le style de nanoGPT implémentée par Andrej Karpathy
  • Implémentation minimale de l’architecture Llama 3.1, sans dépendances, permettant très simplement l’entraînement, le fine-tuning et l’inférence
    • Moins de dépendances et un code plus compact que les implémentations de Meta et HuggingFace
  • Se concentre actuellement sur le modèle de base 8B de Llama 3.1
  • WIP : encore en cours de développement et pas encore finalisé

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.