Le PDG de Nvidia, Jensen Huang, présente une nouvelle puce d’IA : « Il faut un GPU plus grand »
- Nvidia a annoncé lundi une nouvelle génération de puces d’intelligence artificielle (IA) ainsi qu’un logiciel destiné à exécuter des modèles d’IA.
- Le nouveau processeur graphique pour l’IA s’appelle « Blackwell » et devrait être expédié plus tard dans l’année.
- Cette annonce intervient à un moment crucial pour les entreprises et les éditeurs de logiciels, qui s’activent encore pour mettre la main sur des puces similaires à la génération actuelle H100.
Blackwell, le successeur de Hopper
- Nvidia met à jour son architecture GPU tous les deux ans, avec à la clé des bonds de performance majeurs.
- Le GB200, un processeur basé sur Blackwell, offre 20 pétaflops de performances en IA contre 4 pétaflops pour le H100, ce qui permet aux entreprises d’IA d’entraîner des modèles plus grands et plus complexes.
- La puce intègre un « Transformer Engine » spécialement conçu pour exécuter l’IA basée sur les transformeurs, et combine deux dies fabriqués par TSMC en une seule grande puce.
Microservices d’inférence Nvidia
- Nvidia ajoute à son abonnement logiciel Nvidia Enterprise un nouveau produit appelé « NIM » (Nvidia Inference Microservice).
- NIM facilite l’étape d’inférence nécessaire pour exécuter des logiciels d’IA à l’aide des GPU Nvidia existants, permettant aux entreprises de continuer à utiliser les millions de GPU Nvidia qu’elles possèdent déjà.
- Cette stratégie vise à inciter les clients qui achètent des serveurs basés sur Nvidia à souscrire à Nvidia Enterprise, qui facture des frais de licence annuels de 4 500 $ par GPU.
L’avis de GN⁺
- L’annonce de la nouvelle puce d’IA « Blackwell » de Nvidia et du logiciel associé « NIM » symbolise les avancées technologiques dans le domaine de l’IA et souligne l’importance des plateformes matérielles et logicielles pour l’entraînement et l’inférence des modèles d’IA.
- L’amélioration des performances de la puce Blackwell offre aux chercheurs en IA l’opportunité d’expérimenter avec des modèles plus grands et plus complexes, ce qui peut jouer un rôle important dans les progrès de l’IA.
- Cependant, le prix élevé des puces d’IA hautes performances peut constituer une barrière à l’entrée pour certaines entreprises ou institutions de recherche, ce qui peut alimenter le débat sur la démocratisation de la technologie.
- D’autres entreprises en concurrence avec Nvidia développent également des produits dotés de fonctionnalités similaires, comme l’AMD Radeon Instinct ou le TPU de Google, offrant ainsi des alternatives sur le marché du matériel pour l’IA.
- Parmi les éléments à prendre en compte lors de l’adoption de technologies d’IA figurent le coût, les performances, la compatibilité et le support technique ; le nouveau choix technologique de Nvidia peut offrir un avantage majeur aux entreprises pour lesquelles ces critères sont déterminants.
2 commentaires
Il s’agit d’un résumé du contenu d’une vidéo CNET réalisé avec corely.ai (https://www.youtube.com/watch?v=bMIRhOXAjYk)
Avis Hacker News
Il ressort de la conférence que Nvidia évolue dans le sens d’un empilement plus poussé de la stack.
On constate que Nvidia est en train de se transformer en fournisseur de plateforme.
On se demande si FP4 correspond à de la virgule flottante sur 4 bits.
Nvidia a acquis Bright Cluster Manager il y a quelques années.
On demande si « entreprise de plateforme » signifie ici multi-puce.
Ils affirment une réduction de la consommation électrique par 25, ce qui est difficile à comprendre.
Mention d’une production de masse à des niveaux de pétaflops à deux chiffres.
Les revenus data center de Nvidia ont atteint un niveau record de 18,4 milliards de dollars au 4e trimestre 2023.
Le fait que FP8 soit 2,5 fois supérieur à Hopper est un peu décevant après tout ce temps.
Un lien complémentaire est fourni pour plus d’informations techniques.