- Lors de la GTC 2022, annonce de l’architecture Hopper™ de nouvelle génération et du H100 qui en est issu.
→ Nommée d’après Grace Hopper. Elle succède à l’architecture Ampere
- 6 innovations technologiques pour accélérer l’IA à grande échelle et le HPC
- 80 milliards de transistors intégrés grâce au procédé 4 nm de TSMC. Premier GPU à prendre en charge le PCIe Gen5 et à utiliser de la mémoire HBM3 (bande passante mémoire de 3 To/s)
- Nouveau moteur Transformer offrant une accélération 6 fois supérieure à la génération précédente
- Technologie de sécurité Multi-Instance GPU (MIG) de 2e génération : permet de partitionner un GPU en fragments plus petits pour exécuter des charges de travail isolées. Avec l’architecture Hopper, le MIG est amélioré d’un facteur 7 par rapport à la génération précédente
- Premier accélérateur de Confidential Computing pour protéger les modèles d’IA en cours de traitement et les données des clients
- NVIDIA NVLink de 4e génération : relie jusqu’à 256 GPU H100 avec une bande passante 9 fois plus élevée (par rapport à NVIDIA HDR Quantum InfiniBand existant)
- Les nouvelles instructions DPX accélèrent la « programmation dynamique » utilisée en algorithmique, optimisation d’itinéraires et génomique. Jusqu’à 7 fois plus rapide que la génération précédente de GPU, et 40 fois plus rapide qu’un CPU.
- Prise en charge du modèle de langage Megatron 530B avec un débit pouvant être jusqu’à 30 fois supérieur à celui de la génération précédente
1 commentaires
Microsoft et Nvidia présentent MT-NLG 530B, le plus grand modèle de langage au monde