1 points par GN⁺ 2026-03-26 | 1 commentaires | Partager sur WhatsApp
  • Arm a dévoilé un CPU AGI basé sur la plateforme Neoverse, en fournissant directement un silicium prêt pour la production destiné à une infrastructure d’IA autonome
  • Ce CPU est optimisé pour des workloads d’IA parallèles dans des environnements de rack à haute densité, afin de maintenir de hautes performances monothread et une bande passante mémoire élevée même sous charge soutenue
  • Des partenaires majeurs comme Meta, OpenAI et SK Telecom ont déjà commencé des déploiements commerciaux, avec des usages allant de la gestion des accélérateurs à l’orchestration d’agents dans diverses infrastructures d’IA
  • Arm a présenté le 1OU Dual Node Reference Server et cherche à étendre l’écosystème via des form factors standard OCP et des outils open source
  • Cette annonce marque l’entrée affirmée d’Arm sur le marché du silicium pour datacenters, en tant que fondation clé des architectures de datacenters natives pour l’IA

Annonce du CPU Arm AGI : une base en silicium pour l’ère du cloud d’IA agentique

  • Le CPU Arm AGI est un nouveau produit silicium basé sur la plateforme Arm Neoverse, un CPU prêt pour la production conçu pour faire tourner l’infrastructure d’IA de nouvelle génération
  • Pour la première fois en 35 ans d’histoire, Arm fournit directement un produit silicium, en allant au-delà de l’IP et du Compute Subsystem (CSS) pour proposer, de façon optionnelle, des solutions au niveau plateforme et des processeurs conçus par Arm à ses clients
  • Il s’agit d’une réponse à l’évolution rapide de l’infrastructure IA et à la hausse de la demande pour des plateformes Arm déployables à grande échelle

L’essor de l’infrastructure d’IA agentique

  • Les systèmes d’IA entrent à l’échelle mondiale dans une ère de fonctionnement continu et autonome
    • Par le passé, la vitesse d’interaction humaine limitait la vitesse de traitement des systèmes, mais avec l’IA agentique, des agents logiciels interagissent en temps réel avec plusieurs modèles et prennent des décisions
  • Cette évolution fait du CPU l’élément central de coordination de l’infrastructure moderne
    • Le CPU gère les accélérateurs, la mémoire, le stockage, l’ordonnancement des workloads, les déplacements de données et coordonne simultanément de nombreux agents
  • Arm Neoverse sert déjà de base à de grandes plateformes hyperscale et IA comme AWS Graviton, Google Axion, Microsoft Azure Cobalt et NVIDIA Vera
  • Le CPU Arm AGI a été développé pour répondre à ces besoins mondiaux d’expansion de l’infrastructure IA

CPU Arm AGI : conçu pour l’efficacité agentique à l’échelle du rack

  • Le CPU Arm AGI est conçu pour maintenir de hautes performances sur tâche unique même sous charge soutenue dans des environnements massivement parallèles
    • Tous les éléments, de la fréquence de fonctionnement à l’architecture mémoire et I/O, sont optimisés pour prendre en charge des workloads d’IA parallèles dans des déploiements de racks à haute densité
  • La configuration serveur de référence d’Arm adopte une conception 1OU à 2 nœuds, chaque lame intégrant 272 cœurs (2 puces, avec mémoire et I/O dédiés)
    • Un rack de 36 kW refroidi par air peut accueillir 30 lames, soit 8 160 cœurs au total
    • Une conception de 200 kW refroidie par liquide, en partenariat avec Supermicro, peut accueillir 336 CPU Arm AGI, soit plus de 45 000 cœurs au total
  • Cette configuration offre plus de 2 fois les performances par rack par rapport aux systèmes x86 récents*
    • La bande passante mémoire élevée permet de maintenir l’efficacité des threads même sous charge soutenue
    • Les performances monothread basées sur les cœurs Neoverse V3 sont améliorées, ce qui accroît le débit par thread

Diffusion initiale dans l’écosystème IA

  • Le CPU Arm AGI est entré en phase de déploiement commercial avec des partenaires majeurs
    • Les cas d’usage incluent la gestion des accélérateurs, l’orchestration d’agents, la densification des services et applications, ainsi que l’extension du calcul réseau et data plane
  • Meta participe comme partenaire principal et travaille à l’optimisation d’une infrastructure à l’échelle du gigawatt pour la famille d’applications Meta, ainsi qu’à l’intégration avec les accélérateurs MTIA
  • Les premiers partenaires incluent Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP et SK Telecom
    • Des systèmes commerciaux peuvent être commandés via ASRockRack, Lenovo et Supermicro
  • Arm a présenté le Arm AGI CPU 1OU Dual Node Reference Server, proposé au format standard Open Compute Project (OCP) DC-MHS
    • Arm prévoit de contribuer en open source à la conception du serveur, au firmware, aux spécifications d’architecture système, au framework de debug, ainsi qu’aux outils de diagnostic et de validation
    • Des détails supplémentaires seront dévoilés lors de l’OCP EMEA Summit

Un nouveau chapitre pour l’infrastructure Arm

  • Le lancement du CPU Arm AGI marque une nouvelle étape dans la stratégie datacenter d’Arm
    • Il vise à répondre aux besoins d’une clientèle allant du cloud hyperscale aux startups IA
  • Le CPU Arm AGI est le premier modèle de la gamme de produits silicium datacenter d’Arm et peut être commandé dès maintenant
    • Les produits suivants sont en cours de développement avec pour objectif des performances, une scalabilité et une efficacité de tout premier plan
  • En parallèle de la roadmap Arm Neoverse CSS, Arm entend permettre à l’ensemble de ses clients datacenter de conserver une architecture de plateforme commune et une compatibilité logicielle
  • Plus de 50 grandes entreprises soutiennent l’expansion du silicium Arm et entrent dans une phase où elles définissent et construisent directement des architectures de datacenters natives pour l’IA

Résumé des déclarations des partenaires

  • Cerebras

    • Dans la construction d’infrastructures IA axées sur l’inférence à très grande échelle, la scalabilité et l’efficacité du CPU Arm AGI jouent un rôle clé
  • Cloudflare

    • Cloudflare adopte le CPU Arm AGI comme infrastructure de calcul haute performance et basse consommation afin de se développer efficacement à l’échelle de son réseau mondial
  • Meta

    • Développement conjoint avec Arm pour améliorer la densité de performance des datacenters et soutenir une roadmap IA sur plusieurs générations
  • OpenAI

    • Le CPU Arm AGI devrait contribuer au renforcement de la couche d’orchestration des workloads IA à grande échelle ainsi qu’à l’amélioration de l’efficacité système et de la bande passante
  • Positron

    • La combinaison entre la technologie d’accélération d’inférence et l’efficacité énergétique du CPU Arm AGI devrait améliorer les performances et l’efficacité économique des datacenters
  • Rebellions

    • Avec une configuration de serveur haute densité combinant CPU Arm AGI et NPU, Rebellions vise une plateforme optimisée pour les workloads d’inférence à grande échelle
  • SAP

    • SAP souligne la maturité des workloads d’entreprise basés sur Arm et étend le CPU Arm AGI comme base de support à ses solutions métiers IA de nouvelle génération
  • SK Telecom

    • SK Telecom construit une infrastructure de datacenter d’inférence IA à grande échelle intégrant les accélérateurs IA de Rebellions et le CPU Arm AGI, avec pour objectif de renforcer sa compétitivité AIDC

Avertissements et clause de non-responsabilité

  • Ce document contient des déclarations prospectives concernant la roadmap produit d’Arm, ses performances et les plans de déploiement de ses partenaires
    • Les résultats réels peuvent varier en fonction de facteurs tels que la configuration système et les workloads
  • Les chiffres de performance sont des estimations internes d’Arm, fondées sur une comparaison à l’échelle du rack entre un serveur basé sur le CPU Arm AGI et un serveur x86 de catégorie équivalente*
  • Tous les noms de produits et d’entreprises sont des marques ou des marques déposées de leurs propriétaires respectifs

1 commentaires

 
GN⁺ 2026-03-26
Avis sur Hacker News
  • Le nom de ce CPU relève presque de la fraude boursière
    Aujourd’hui, quand on dit « AGI », la plupart des gens pensent à Artificial General Intelligence, mais Arm l’utilise pour « Agentic AI Infrastructure »
    Les investisseurs particuliers ne verront pas la différence et achèteront l’action ARM, et Arm le sait. Dans le secteur, on appelle ça un « mensonge »

    • De nos jours, AGI n’est plus qu’un terme marketing. On va bientôt avoir du déodorant parfum AGI
    • Le marketing autour de la 5G, c’était pareil. On parlait de 5G avant même un vrai déploiement, en créant une confusion chez les consommateurs
      Comme l’expliquait aussi cet article de PBS, le marketing recycle toujours les termes de cette façon
    • Si les riches sont aussi bêtes, tant pis s’ils perdent leur argent
      On ne peut pas protéger par la loi quelqu’un qui investit sans rien vérifier
    • Au contraire, je trouve que ce nom exagéré est une bonne chose
      Ce genre de marketing délirant pourrait pousser le secteur à abandonner le terme « AGI » et à revenir au réel
    • Ce genre de marketing est vraiment agaçant
      Reprendre un terme existant pour lui coller un nouveau sens, c’est une vieille technique
      Le « Personal Computer » d’IBM, « Windows » de Microsoft et « Core » d’Intel, c’était déjà ça
      (Pour info, je suis un petit actionnaire d’ARM)
  • En réalité, Arm va simplement fabriquer et vendre directement des CPU Neoverse
    Ce n’est pas un CPU IA. Il ne se distingue pas de Graviton, Epyc ou Xeon
    C’était déjà apparu il y a quelques années dans le procès Qualcomm vs Arm
    Arm prévoyait non seulement d’accorder des licences, mais aussi de vendre ses propres CPU. Le PDG l’avait nié à l’époque, mais c’était bien vrai au final
    J’ai aussi écrit un post à ce sujet

    • Ça me rappelle l’époque où Intel faisait la promo du Pentium comme si naviguer sur le web allait plus vite
    • J’ai pensé la même chose au départ. En lisant le billet de blog, il est clair qu’ARM veut concurrencer directement ses clients
      D’où probablement ce nom pour surfer sur la vague de l’IA
      Mais les fabricants de matériel verront clair dans ce bluff. Au bout du compte, si le prix n’est pas compétitif, ça ne se vendra pas
    • Le pire, c’est qu’il existe déjà des SoC avec de vrais accélérateurs IA (NPU), et celui-ci n’en a même pas
  • Ce qui est intéressant, c’est qu’Arm sort son premier produit silicium maison en 35 ans d’histoire

    • On dirait que des ingénieurs frustrés d’avoir vu pendant des décennies d’autres entreprises faire n’importe quoi avec des cœurs ARM ont enfin l’occasion de montrer ce qu’ils savent faire
    • Voir ARM fabriquer directement des puces, c’est comme si TSMC se mettait à vendre ses propres CPU
      ARM va désormais concurrencer directement ses clients
    • Au final, l’attrait de la course au silicium IA semble avoir été trop fort
      On en est arrivé au point où vendre des puces rapporte plus que les licences
    • Cela dit, le VLSI qui a fabriqué l’ARM1 produisait déjà du silicium ARM. Ce n’est donc pas entièrement inédit
    • Pour faire ça, il faudra recruter de nouveaux ingénieurs en Design Verification, et c’est un gros coût
  • AGI veut dire Agentic AI Infrastructure
    Au cas où vous auriez pensé à autre chose

    • On dirait un résumé poétique de la réalité actuelle du secteur de l’IA. Un beau paysage, mais amer
    • Ils auraient presque dû l’appeler AAII et dire que c’est « deux fois plus puissant que l’IA », ça aurait été plus drôle
    • Je ne sais même pas quelles lettres sont censées être mises en avant dans AGI
      Quand on voit à quel point ARM distinguait proprement ses profils A, R et M, c’est décevant
    • C’est juste… quelque chose. Pas dans le bon sens du terme
    • On dirait quelqu’un qui saute par-dessus un requin tout en perdant son pantalon. Volontaire ou non, c’est marquant
  • AGI (Agentic AI Infrastructure) serait ajouté à la gamme en même temps que CSS (Compute Subsystems)
    Je me demande vraiment qui invente ces noms

    • Probablement les mêmes qui ont fait en sorte que « Generative AI » sonne comme « General AI »
      L’arnaque semble être le mode de vie naturel des marketeux
    • Donc ce n’est pas Artificial General Intelligence qui fait équipe avec Cascading Style Sheets ?
  • C’est comme appeler son enfant World President Smith

    • Mais étonnamment, ça pourrait marcher
      Selon un article de l’APA, le nom peut influencer le comportement
      Mon agent immobilier s’appelle même House
  • Aujourd’hui, tout est AGI
    Hier, c’était agentic, avant-hier c’était IA
    Bientôt, on aura du papier toilette AGI Agentic AI Crypto dans les supermarchés, juste à côté des boîtes de thon UML Rational Rose

  • Arm va maintenant vendre directement ses propres CPU

  • Je ne comprends pas ce que veut dire « Built for rack-scale agentic efficiency »

    • Une fois le slogan marketing dépassé, on parle d’un gros système multicœur de 136 cœurs pour 300 W misant sur l’efficacité
      Selon Arm, les futures charges de travail agentiques solliciteront à la fois CPU et GPU, donc l’efficacité côté CPU est importante
    • On est à une époque où il suffit juste d’aligner des mots qui sonnent bien
    • En gros, c’est une notion de densité de calcul agentique = « consommation de tokens × nombre d’agents × espace rack »
    • Ça rappelle le mème « mongodb is web scale »
    • On dirait une question du genre « combien d’anges peuvent danser sur la pointe d’une aiguille ? »
      Voir le lien Wikipédia