-
Un langage de programmation et un compilateur similaires à Python
-
Même les chercheurs sans expérience de CUDA peuvent facilement écrire du code GPU très efficace pour le deep learning
→ Des implémentations de noyaux déjà environ 2 fois plus efficaces que celles de Torch
-
Prise en charge de Linux et des GPU NVIDIA (les GPU AMD et d'autres CPU sont en cours de développement)
-
Le code de base est similaire à Numba, mais n'utilise pas le SIMT et exécute en parallèle dans l'instance des opérations au niveau des blocs
-
Une architecture qui convertit le code Python en Triton-IR, puis en LLVM-IR via le compilateur Triton
1 commentaires
Article de l’auteur original : http://eecs.harvard.edu/~htk/publication/…
(OpenAI a recruté Philippe Tillet et continue de soutenir son développement)