62 points par xguru 2023-01-25 | 2 commentaires | Partager sur WhatsApp
  • Un cours de développement de réseaux de neurones créé par Andrej Karpathy, ancien responsable IA chez Tesla
  • Il part des bases de la rétropropagation (backpropagation) pour aller jusqu’au développement de réseaux de neurones profonds récents comme GPT
  • Les modèles de langage sont un excellent support pour apprendre le deep learning. Même si l’on s’étend ensuite à des domaines comme la vision par ordinateur, la plupart des apprentissages sont immédiatement réutilisables

Syllabus

  • (2h25m) Introduction détaillée aux réseaux de neurones et à la rétropropagation : création de micrograd
  • (1h57m) Introduction détaillée à la modélisation du langage : création de makemore
  • (1h15m) Création de makemore, partie 2 : MLP
  • (1h55m) Création de makemore, partie 3 : activations, gradients, BatchNorm
  • (1h55m) Création de makemore, partie 4 : devenir un ninja de la rétropropagation
  • (56m) Création de makemore, partie 5 : création d’un WaveNet
  • (1h56m) Construisons GPT : depuis zéro, en code, pas à pas.

2 commentaires

 
awew78787 2023-02-22

Yep

 
xguru 2023-01-25

La semaine dernière, j’avais seulement partagé le lien vers Let's build GPT - Construisons GPT à partir de zéro [vidéo YouTube],
mais il s’avère que ce n’était qu’une partie de l’ensemble du cours.