8 points par xguru 2023-01-04 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Code réécrit par Andrej Karpathy, ancien responsable IA chez Tesla, à partir de minGPT
  • Objectif : écrire un code lisible et simple
    • train.py d’environ 300 lignes
    • model.py d’environ 300 lignes
  • Reproduction en cours de GPT-2 sur le jeu de données OpenWebText

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.