32 points par xguru 2023-02-13 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Un tutoriel pour implémenter simplement GPT en partant du principe que l’on est familier avec Python et NumPy, puis charger le modèle GPT-2 publié par OpenAI afin de générer du texte

Sommaire

  • Qu’est-ce que GPT ?
  • Configuration : Encoder, Hyperparameters, Parameters
  • Couches de base : GeLU, Softmax, Layer Normalization, Linear
  • Architecture de GPT
    • Embeddings
    • Pile de décodeurs
    • Projection vers le vocabulaire
    • Bloc de décodeur
    • Réseau feed-forward positionnel
    • Attention causale multi-tête auto-régressive
  • Tout assembler
  • What's Next?
    • Support GPU/TPU
    • Backpropagation
    • Batching
    • Optimisation de l’inférence
    • Entraînement
    • Évaluation
    • Améliorations de l’architecture

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.