- Arm a dévoilé un CPU AGI basé sur la plateforme Neoverse, en fournissant directement un silicium prêt pour la production destiné à une infrastructure d’IA autonome
- Ce CPU est optimisé pour des workloads d’IA parallèles dans des environnements de rack à haute densité, afin de maintenir de hautes performances monothread et une bande passante mémoire élevée même sous charge soutenue
- Des partenaires majeurs comme Meta, OpenAI et SK Telecom ont déjà commencé des déploiements commerciaux, avec des usages allant de la gestion des accélérateurs à l’orchestration d’agents dans diverses infrastructures d’IA
- Arm a présenté le 1OU Dual Node Reference Server et cherche à étendre l’écosystème via des form factors standard OCP et des outils open source
- Cette annonce marque l’entrée affirmée d’Arm sur le marché du silicium pour datacenters, en tant que fondation clé des architectures de datacenters natives pour l’IA
Annonce du CPU Arm AGI : une base en silicium pour l’ère du cloud d’IA agentique
- Le CPU Arm AGI est un nouveau produit silicium basé sur la plateforme Arm Neoverse, un CPU prêt pour la production conçu pour faire tourner l’infrastructure d’IA de nouvelle génération
- Pour la première fois en 35 ans d’histoire, Arm fournit directement un produit silicium, en allant au-delà de l’IP et du Compute Subsystem (CSS) pour proposer, de façon optionnelle, des solutions au niveau plateforme et des processeurs conçus par Arm à ses clients
- Il s’agit d’une réponse à l’évolution rapide de l’infrastructure IA et à la hausse de la demande pour des plateformes Arm déployables à grande échelle
L’essor de l’infrastructure d’IA agentique
- Les systèmes d’IA entrent à l’échelle mondiale dans une ère de fonctionnement continu et autonome
- Par le passé, la vitesse d’interaction humaine limitait la vitesse de traitement des systèmes, mais avec l’IA agentique, des agents logiciels interagissent en temps réel avec plusieurs modèles et prennent des décisions
- Cette évolution fait du CPU l’élément central de coordination de l’infrastructure moderne
- Le CPU gère les accélérateurs, la mémoire, le stockage, l’ordonnancement des workloads, les déplacements de données et coordonne simultanément de nombreux agents
- Arm Neoverse sert déjà de base à de grandes plateformes hyperscale et IA comme AWS Graviton, Google Axion, Microsoft Azure Cobalt et NVIDIA Vera
- Le CPU Arm AGI a été développé pour répondre à ces besoins mondiaux d’expansion de l’infrastructure IA
CPU Arm AGI : conçu pour l’efficacité agentique à l’échelle du rack
- Le CPU Arm AGI est conçu pour maintenir de hautes performances sur tâche unique même sous charge soutenue dans des environnements massivement parallèles
- Tous les éléments, de la fréquence de fonctionnement à l’architecture mémoire et I/O, sont optimisés pour prendre en charge des workloads d’IA parallèles dans des déploiements de racks à haute densité
- La configuration serveur de référence d’Arm adopte une conception 1OU à 2 nœuds, chaque lame intégrant 272 cœurs (2 puces, avec mémoire et I/O dédiés)
- Un rack de 36 kW refroidi par air peut accueillir 30 lames, soit 8 160 cœurs au total
- Une conception de 200 kW refroidie par liquide, en partenariat avec Supermicro, peut accueillir 336 CPU Arm AGI, soit plus de 45 000 cœurs au total
- Cette configuration offre plus de 2 fois les performances par rack par rapport aux systèmes x86 récents*
- La bande passante mémoire élevée permet de maintenir l’efficacité des threads même sous charge soutenue
- Les performances monothread basées sur les cœurs Neoverse V3 sont améliorées, ce qui accroît le débit par thread
Diffusion initiale dans l’écosystème IA
- Le CPU Arm AGI est entré en phase de déploiement commercial avec des partenaires majeurs
- Les cas d’usage incluent la gestion des accélérateurs, l’orchestration d’agents, la densification des services et applications, ainsi que l’extension du calcul réseau et data plane
- Meta participe comme partenaire principal et travaille à l’optimisation d’une infrastructure à l’échelle du gigawatt pour la famille d’applications Meta, ainsi qu’à l’intégration avec les accélérateurs MTIA
- Les premiers partenaires incluent Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP et SK Telecom
- Des systèmes commerciaux peuvent être commandés via ASRockRack, Lenovo et Supermicro
- Arm a présenté le Arm AGI CPU 1OU Dual Node Reference Server, proposé au format standard Open Compute Project (OCP) DC-MHS
- Arm prévoit de contribuer en open source à la conception du serveur, au firmware, aux spécifications d’architecture système, au framework de debug, ainsi qu’aux outils de diagnostic et de validation
- Des détails supplémentaires seront dévoilés lors de l’OCP EMEA Summit
Un nouveau chapitre pour l’infrastructure Arm
- Le lancement du CPU Arm AGI marque une nouvelle étape dans la stratégie datacenter d’Arm
- Il vise à répondre aux besoins d’une clientèle allant du cloud hyperscale aux startups IA
- Le CPU Arm AGI est le premier modèle de la gamme de produits silicium datacenter d’Arm et peut être commandé dès maintenant
- Les produits suivants sont en cours de développement avec pour objectif des performances, une scalabilité et une efficacité de tout premier plan
- En parallèle de la roadmap Arm Neoverse CSS, Arm entend permettre à l’ensemble de ses clients datacenter de conserver une architecture de plateforme commune et une compatibilité logicielle
- Plus de 50 grandes entreprises soutiennent l’expansion du silicium Arm et entrent dans une phase où elles définissent et construisent directement des architectures de datacenters natives pour l’IA
Résumé des déclarations des partenaires
-
Cerebras
- Dans la construction d’infrastructures IA axées sur l’inférence à très grande échelle, la scalabilité et l’efficacité du CPU Arm AGI jouent un rôle clé
-
Cloudflare
- Cloudflare adopte le CPU Arm AGI comme infrastructure de calcul haute performance et basse consommation afin de se développer efficacement à l’échelle de son réseau mondial
-
Meta
- Développement conjoint avec Arm pour améliorer la densité de performance des datacenters et soutenir une roadmap IA sur plusieurs générations
-
OpenAI
- Le CPU Arm AGI devrait contribuer au renforcement de la couche d’orchestration des workloads IA à grande échelle ainsi qu’à l’amélioration de l’efficacité système et de la bande passante
-
Positron
- La combinaison entre la technologie d’accélération d’inférence et l’efficacité énergétique du CPU Arm AGI devrait améliorer les performances et l’efficacité économique des datacenters
-
Rebellions
- Avec une configuration de serveur haute densité combinant CPU Arm AGI et NPU, Rebellions vise une plateforme optimisée pour les workloads d’inférence à grande échelle
-
SAP
- SAP souligne la maturité des workloads d’entreprise basés sur Arm et étend le CPU Arm AGI comme base de support à ses solutions métiers IA de nouvelle génération
-
SK Telecom
- SK Telecom construit une infrastructure de datacenter d’inférence IA à grande échelle intégrant les accélérateurs IA de Rebellions et le CPU Arm AGI, avec pour objectif de renforcer sa compétitivité AIDC
Avertissements et clause de non-responsabilité
- Ce document contient des déclarations prospectives concernant la roadmap produit d’Arm, ses performances et les plans de déploiement de ses partenaires
- Les résultats réels peuvent varier en fonction de facteurs tels que la configuration système et les workloads
- Les chiffres de performance sont des estimations internes d’Arm, fondées sur une comparaison à l’échelle du rack entre un serveur basé sur le CPU Arm AGI et un serveur x86 de catégorie équivalente*
- Tous les noms de produits et d’entreprises sont des marques ou des marques déposées de leurs propriétaires respectifs
1 commentaires
Avis sur Hacker News
Le nom de ce CPU relève presque de la fraude boursière
Aujourd’hui, quand on dit « AGI », la plupart des gens pensent à Artificial General Intelligence, mais Arm l’utilise pour « Agentic AI Infrastructure »
Les investisseurs particuliers ne verront pas la différence et achèteront l’action ARM, et Arm le sait. Dans le secteur, on appelle ça un « mensonge »
Comme l’expliquait aussi cet article de PBS, le marketing recycle toujours les termes de cette façon
On ne peut pas protéger par la loi quelqu’un qui investit sans rien vérifier
Ce genre de marketing délirant pourrait pousser le secteur à abandonner le terme « AGI » et à revenir au réel
Reprendre un terme existant pour lui coller un nouveau sens, c’est une vieille technique
Le « Personal Computer » d’IBM, « Windows » de Microsoft et « Core » d’Intel, c’était déjà ça
(Pour info, je suis un petit actionnaire d’ARM)
En réalité, Arm va simplement fabriquer et vendre directement des CPU Neoverse
Ce n’est pas un CPU IA. Il ne se distingue pas de Graviton, Epyc ou Xeon
C’était déjà apparu il y a quelques années dans le procès Qualcomm vs Arm
Arm prévoyait non seulement d’accorder des licences, mais aussi de vendre ses propres CPU. Le PDG l’avait nié à l’époque, mais c’était bien vrai au final
J’ai aussi écrit un post à ce sujet
D’où probablement ce nom pour surfer sur la vague de l’IA
Mais les fabricants de matériel verront clair dans ce bluff. Au bout du compte, si le prix n’est pas compétitif, ça ne se vendra pas
Ce qui est intéressant, c’est qu’Arm sort son premier produit silicium maison en 35 ans d’histoire
ARM va désormais concurrencer directement ses clients
On en est arrivé au point où vendre des puces rapporte plus que les licences
AGI veut dire Agentic AI Infrastructure
Au cas où vous auriez pensé à autre chose
Quand on voit à quel point ARM distinguait proprement ses profils A, R et M, c’est décevant
AGI (Agentic AI Infrastructure) serait ajouté à la gamme en même temps que CSS (Compute Subsystems)
Je me demande vraiment qui invente ces noms
L’arnaque semble être le mode de vie naturel des marketeux
C’est comme appeler son enfant World President Smith
Selon un article de l’APA, le nom peut influencer le comportement
Mon agent immobilier s’appelle même House
Aujourd’hui, tout est AGI
Hier, c’était agentic, avant-hier c’était IA
Bientôt, on aura du papier toilette AGI Agentic AI Crypto dans les supermarchés, juste à côté des boîtes de thon UML Rational Rose
Arm va maintenant vendre directement ses propres CPU
Je ne comprends pas ce que veut dire « Built for rack-scale agentic efficiency »
Selon Arm, les futures charges de travail agentiques solliciteront à la fois CPU et GPU, donc l’efficacité côté CPU est importante
Voir le lien Wikipédia