- Bibliothèque Tensor haute performance et framework de deep learning en Rust, pour le calcul numérique, l’inférence de modèles et l’entraînement
- Conserve les performances d’optimisation d’un framework à graphe statique tout en offrant la flexibilité du dynamique
- Prise en charge de multiples backends GPU/CPU
- GPU : CUDA, ROCm, Metal, Vulkan, WebGPU, LibTorch, Candle, etc.
- CPU : basés sur CubeCL, NdArray, Candle et LibTorch
- Fonctionne aussi dans des environnements Wasm et no_std
- Conçu autour du trait Backend, avec une architecture de backends interchangeables pour divers matériels et environnements d’exécution
- Décorateur de backend Autodiff : ajoute la différentiation automatique à tous les backends
- Décorateur de backend Fusion : fonctionnalité de fusion de kernels
- Backend Router : prend en charge la répartition des calculs entre plusieurs matériels comme le CPU et le GPU
- Backend Remote : permet les calculs distribués et l’exécution à distance via le réseau
- Prise en charge intégrée de l’ensemble du cycle d’entraînement et d’inférence
- Supervision en temps réel de l’entraînement via un tableau de bord terminal basé sur Ratatui
- Déploiement du même code, des appareils embarqués jusqu’aux grands clusters GPU
- Réutilisation de modèles existants grâce à l’import de modèles PyTorch, Safetensors et ONNX
- Inférence dans le navigateur via WebAssembly et WebGPU
- La prise en charge de no_std permet aussi une exécution sur des appareils embarqués sans système d’exploitation
- Distribué sous double licence MIT/Apache 2.0
2 commentaires
Je me demande quelles sont ses performances par rapport à PyTorch.
Rust, Wasm, WebGPU : que de noms réjouissants.