NVIDIA annonce le GPU H100 basé sur l’architecture Hopper

xguru · 2022-03-23T12:03:16+09:00

Lors de la GTC 2022, annonce de l’architecture Hopper™ de nouvelle génération et du H100 qui en est issu. → Nommée d’après Grace Hopper. Elle succède à l’architecture Ampere 6 innovations technologiques pour accélérer l’IA à grande échelle et le HPC 80 milliards de transistors intégrés grâce au procédé 4 nm de TSMC. Premier GPU à prendre en charge le PCIe Gen5 et à utiliser de la mémoire HBM3 (bande passante mémoire de 3 To/s) Nouveau moteur Transformer offrant une accélération 6 fois supérieure à la génération précédente Technologie de sécurité Multi-Instance GPU (MIG) de 2e génération : permet de partitionner un GPU en fragments plus petits pour exécuter des charges de travail isolées. Avec l’architecture Hopper, le MIG est amélioré d’un facteur 7 par rapport à la génération précédente Premier accélérateur de Confidential Computing pour protéger les modèles d’IA en cours de traitement et les données des clients NVIDIA NVLink de 4e génération : relie jusqu’à 256 GPU H100 avec une bande passante 9 fois plus élevée (par rapport à NVIDIA HDR Quantum InfiniBand existant) Les nouvelles instructions DPX accélèrent la « programmation dynamique » utilisée en algorithmique, optimisation d’itinéraires et génomique. Jusqu’à 7 fois plus rapide que la génération précédente de GPU, et 40 fois plus rapide qu’un CPU. Prise en charge du modèle de langage Megatron 530B avec un débit pouvant être jusqu’à 30 fois supérieur à celui de la génération précédente

(nvidianews.nvidia.com)

2 points par xguru 2022-03-23 | 1 commentaires | Partager sur WhatsApp

Lors de la GTC 2022, annonce de l’architecture Hopper™ de nouvelle génération et du H100 qui en est issu.
→ Nommée d’après Grace Hopper. Elle succède à l’architecture Ampere
6 innovations technologiques pour accélérer l’IA à grande échelle et le HPC
- 80 milliards de transistors intégrés grâce au procédé 4 nm de TSMC. Premier GPU à prendre en charge le PCIe Gen5 et à utiliser de la mémoire HBM3 (bande passante mémoire de 3 To/s)
- Nouveau moteur Transformer offrant une accélération 6 fois supérieure à la génération précédente
- Technologie de sécurité Multi-Instance GPU (MIG) de 2e génération : permet de partitionner un GPU en fragments plus petits pour exécuter des charges de travail isolées. Avec l’architecture Hopper, le MIG est amélioré d’un facteur 7 par rapport à la génération précédente
- Premier accélérateur de Confidential Computing pour protéger les modèles d’IA en cours de traitement et les données des clients
- NVIDIA NVLink de 4e génération : relie jusqu’à 256 GPU H100 avec une bande passante 9 fois plus élevée (par rapport à NVIDIA HDR Quantum InfiniBand existant)
- Les nouvelles instructions DPX accélèrent la « programmation dynamique » utilisée en algorithmique, optimisation d’itinéraires et génomique. Jusqu’à 7 fois plus rapide que la génération précédente de GPU, et 40 fois plus rapide qu’un CPU.
Prise en charge du modèle de langage Megatron 530B avec un débit pouvant être jusqu’à 30 fois supérieur à celui de la génération précédente

1 commentaires

xguru 2022-03-23

Microsoft et Nvidia présentent MT-NLG 530B, le plus grand modèle de langage au monde

NVIDIA annonce le GPU H100 basé sur l’architecture Hopper

À lire aussi

1 commentaires