3 points par GN⁺ 2024-10-13 | 1 commentaires | Partager sur WhatsApp

Turin d’AMD : lancement de la 5e génération d’EPYC

  • CPU serveur à 5 gigahertz
    • Présentation du nouveau CPU serveur d’AMD, l’EPYC 9575F, dans un article rédigé à partir d’une expérience pratique directe, contrairement au précédent Granite Rapids.
    • Les différences entre les versions mobiles et desktop des cœurs Zen 5 ayant déjà été traitées, cet article se concentre cette fois sur les changements du sous-système mémoire de Turin.

Bande passante mémoire

  • Le 9575F enregistre une bande passante de lecture mémoire d’environ 52GB/s, une bande passante d’écriture de 48GB/s et une bande passante lecture-modification-écriture de 95GB/s.
  • En observant l’utilisation de la bande passante mémoire sur un seul CCD, un seul cœur peut utiliser moins de la moitié de la bande passante totale de lecture mémoire du CCD, environ 55 % de la bande passante d’écriture et plus des deux tiers de la bande passante lecture-modification-écriture.
  • Le 9575F offre une bande passante vers le CCD nettement plus élevée que les composants desktop Zen 5, car il fournit deux liens GMI vers l’IO die via GMI3-W.
  • Turin prend en charge jusqu’à la DDR5-6400MT/s, uniquement sur certains systèmes en configuration 1 DIMM par canal. La plupart des systèmes prennent en charge 6000MT/s, et la configuration en 2 DIMM par canal fait tomber la vitesse à 4400 MT/s.

Latence mémoire

  • La latence mémoire à vide de Turin est similaire à celle de Genoa.
  • Les mesures de latence mémoire en charge montrent une augmentation d’environ 39 nanosecondes par rapport à l’état à vide lorsqu’un seul CCD est chargé, et d’environ 31 nanosecondes lorsque l’ensemble du système est sous charge.
  • La latence à l’intérieur d’un CCD est d’environ 45ns, la latence entre CCD d’environ 150ns et la latence entre sockets d’environ 260ns, soit une hausse par rapport à Genoa.

Fréquence d’horloge

  • Les 64 cœurs du 9575F peuvent tous atteindre jusqu’à 5GHz en test mono-thread, et 8 cœurs fonctionnent à 5GHz lors des tests de bande passante mémoire.
  • Dans Cinebench 2024, lorsque 128 threads sont actifs, le 9575F maintient environ 4.3GHz, tandis que sur des charges de travail de serveur web / transactions TLS, il atteint environ 4.9GHz.

Conclusion

  • Le Turin d’AMD constitue une mise à jour générationnelle prévisible, avec des SKU à nombre élevé de cœurs et des SKU à faible nombre de cœurs mais à haute fréquence, afin de répondre aux besoins de différents marchés.
  • Turin se rapproche davantage d’une évolution de Milan vers Genoa que d’un changement révolutionnaire comme celui de Naples vers Rome, avec une augmentation de la bande passante mémoire, du nombre de cœurs et une mise à jour des cœurs.
  • Cette génération apporte beaucoup de valeur dans un écosystème concurrentiel et suscitera l’intérêt de nombreuses personnes.

Le récapitulatif de GN⁺

  • Le Turin d’AMD marque une avancée importante sur le marché des CPU serveurs, avec des améliorations particulièrement notables en bande passante mémoire et en performances des cœurs.
  • Cet article est utile pour les personnes qui cherchent à comprendre les dernières technologies d’AMD et peut aider les ingénieurs intéressés par l’optimisation des performances serveur.
  • Parmi les produits aux fonctionnalités similaires à Turin figurent les séries Xeon d’Intel, et une comparaison avec AMD permet d’identifier les avantages et inconvénients de chaque produit.

1 commentaires

 
GN⁺ 2024-10-13
Commentaires sur Hacker News
  • L’AMD EPYC 9175F est un produit atypique avec 16 cœurs et 512 Mo de cache L3. Cela semble viser les clients qui veulent minimiser les coûts de licence « par cœur ». Je me demande si Oracle utilise encore ce type de licence

    • Pour certains usages spécifiques comme le HFT, on peut aussi vouloir faire tenir tout l’algorithme dans le L3 afin de minimiser la latence
    • Mais il est plus probable qu’il s’agisse surtout d’un sujet lié aux licences logicielles
  • Phoronix a publié un comparatif entre le Turin Dense à 196 cœurs et l’AmpereOne à 192 cœurs

    • Le MSRP d’Ampere est de 5,5 k$, celui de l’EPYC est de 15 k$
    • Le Turin 196 offre des performances 1,6 fois supérieures
    • Ampere est 1,2 fois plus efficace en consommation d’énergie
    • En termes réels de $/performance, l’Ampere 192 cœurs est 1,7 fois meilleur que le Turin Dense 196 cœurs
  • Pour 5,5 k$, on peut acheter soit un CPU AmpereOne 192 cœurs (274 W), soit un CPU Turin Dense 48 cœurs (300 W)

    • Ampere prévoit de lancer l’an prochain un produit à 256 cœurs, en 3 nm, avec 12 canaux mémoire, qui pourrait être un concurrent plus crédible face au Turin Dense et au Sierra Forest sur le terrain des performances
    • Pour l’instant, leur proposition de valeur repose sur le ratio $/performance
  • Je suis très curieux des performances de la puce serveur de Qualcomm basée sur Nuvia

    • Si les progrès des cœurs client d’ARM sont un indicateur, je suis très curieux de voir comment les puces maison comme AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace et Alibaba Yitian rivaliseront avec de meilleurs cœurs Neoverse
    • J’attends avec intérêt la concurrence entre Nuvia, ARM et AmpereOne
  • Nous vivons peut-être actuellement l’âge d’or des CPU serveur

    • Il y a 7 ans, il n’y avait que les Xeon d’Intel
    • Maintenant, il y a de nombreuses options
  • J’ai hâte de voir Hetzner déployer des serveurs bare metal AMD Turin

    • La génération précédente offrait déjà un excellent rapport qualité-prix, mais cette fois on a l’impression qu’ils sont allés encore plus loin
  • Il y a 20 ans, on n’avait que 1 ou 2 cœurs par CPU, et avoir 4 cœurs dans un serveur bi-socket relevait déjà de la chance

    • Aujourd’hui, on peut avoir près de 400 cœurs dans un seul serveur
    • Les cœurs ARM peuvent être plus nombreux, mais pour l’instant ils n’offrent pas encore des performances aussi bonnes que celles-ci
  • Pour ceux qui n’aiment pas le passage à Substack, il existe un site alternatif

  • J’utilise un Dell PowerEdge vieux de 12 ans avec deux Xeon

    • J’attends avec impatience que les serveurs Epyc de première génération arrivent à bas prix sur eBay
  • ChipsAndCheese fait partie des nouvelles publications techniques, avec une expertise remarquable, notamment dans les benchmarks approfondis

    • Alors que d’anciens sites tech comme Anandtech, TechReport et HardCOP ont disparu, c’est rassurant de voir de nouveaux éditeurs capables de préserver ce style
  • Sorti au bon moment pour Factorio 2.0

  • J’aimerais voir le 9965 en fonctionnement réel

    • Ces composants sont impressionnants
    • Je prévois d’acheter une machine de cette génération
  • Il y a un graphique du TDP à 1:11 dans la vidéo

    • Entre 125 et 500 W, ça chauffe vraiment beaucoup