Google publie en open source Switch Transformer, un modèle d’IA NLP de 1,6 billion de paramètres

xguru · 2021-02-19T10:43:21+09:00

Vitesse d’entraînement améliorée de 7x par rapport au modèle existant T5 (Text-to-Text Transfer Transformer) Algorithme MoE (Mixture-of-Experts) modifié appelé Switch Routing, qui applique des paramètres différents selon les valeurs d’entrée Utilisation de Mesh-Tensorflow pour l’entraînement du modèle (Model Parallelism)

(infoq.com)

3 points par xguru 2021-02-19 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Vitesse d’entraînement améliorée de 7x par rapport au modèle existant T5 (Text-to-Text Transfer Transformer)
Algorithme MoE (Mixture-of-Experts) modifié appelé Switch Routing, qui applique des paramètres différents selon les valeurs d’entrée
Utilisation de Mesh-Tensorflow pour l’entraînement du modèle (Model Parallelism)

Google publie en open source Switch Transformer, un modèle d’IA NLP de 1,6 billion de paramètres

À lire aussi

Aucun commentaire pour le moment.