7 points par xguru 2021-07-29 | 1 commentaires | Partager sur WhatsApp
  • Un langage de programmation et un compilateur similaires à Python

  • Même les chercheurs sans expérience de CUDA peuvent facilement écrire du code GPU très efficace pour le deep learning

→ Des implémentations de noyaux déjà environ 2 fois plus efficaces que celles de Torch

  • Prise en charge de Linux et des GPU NVIDIA (les GPU AMD et d'autres CPU sont en cours de développement)

  • Le code de base est similaire à Numba, mais n'utilise pas le SIMT et exécute en parallèle dans l'instance des opérations au niveau des blocs

  • Une architecture qui convertit le code Python en Triton-IR, puis en LLVM-IR via le compilateur Triton

1 commentaires

 
xguru 2021-07-29

Article de l’auteur original : http://eecs.harvard.edu/~htk/publication/…

(OpenAI a recruté Philippe Tillet et continue de soutenir son développement)