MTIA v1 : l’accélérateur d’inférence IA de 1re génération de Meta
(ai.facebook.com)- Les GPU ne sont pas optimaux pour exécuter le DLRM (modèle de recommandation par deep learning) de Meta
- Meta a donc développé un ASIC Meta Training and Inference Accelerator (MTIA) adapté aux recommandations
- Conçu conjointement en gardant à l’esprit les exigences des modèles de recommandation de nouvelle génération, puis intégré à PyTorch pour construire un système de classement entièrement optimisé
- Procédé TSMC 7 nm, 800 MHz, 102.4 TOPS @ INT8, 51.2 TFLOPS @ FP16, 25 W
Aucun commentaire pour le moment.