nanoGPT - open source pour entraîner/affiner des GPT de taille intermédiaire le plus rapidement possible
(github.com/karpathy)- Code réécrit par Andrej Karpathy, ancien responsable IA chez Tesla, à partir de minGPT
- Objectif : écrire un code lisible et simple
train.pyd’environ 300 lignesmodel.pyd’environ 300 lignes
- Reproduction en cours de GPT-2 sur le jeu de données OpenWebText
Aucun commentaire pour le moment.