La mémoire représente désormais près des deux tiers du coût des composants des puces IA

(epoch.ai)

2 points par GN⁺ 2026-05-25 | 1 commentaires | Partager sur WhatsApp

La HBM est passée de 52 % au T1 2024 à 63 % au T4 2025 selon la moyenne pondérée par les volumes de production des puces IA de Nvidia, AMD, Google et Amazon
Sur la même période, la part des logic dies est restée presque stable à environ 13 %, tandis que le packaging avancé est passé de 19 % à 15 % et les composants auxiliaires de 15 % à 9 %
Les dépenses en HBM des quatre concepteurs sont passées d’environ 12 milliards de dollars en 2024 à 32 milliards de dollars en 2025, avec une croissance annuelle plus rapide que celle des autres composants
Les dépenses totales en composants de puces IA sont passées d’environ 22 milliards de dollars à 52 milliards de dollars, et la seule HBM représente environ 20 milliards de dollars de cette hausse
En 2026, la pression sur les coûts pourrait encore s’accentuer avec la pénurie de mémoire et la hausse des prix, tandis que Microsoft et Meta ont aussi cité la hausse des prix des composants comme facteur d’augmentation de leurs dépenses d’investissement

Principaux changements

La part de la mémoire à large bande passante (HBM) dans les dépenses en composants de puces IA est passée de 52 % au T1 2024 à 63 % au T4 2025
Cette estimation correspond à une moyenne pondérée par les volumes de production sur l’ensemble des puces IA conçues par Nvidia, AMD, Google et Amazon
Sur la même période, les logic dies sont restés presque inchangés autour de 13 %, tandis que le packaging avancé est passé de 19 % à 15 % et les composants auxiliaires de 15 % à 9 %
Les dépenses en HBM des quatre concepteurs sont passées d’environ 12 milliards de dollars en 2024 à 32 milliards de dollars en 2025, avec une progression annuelle plus rapide que celle des autres composants
Les dépenses totales en composants de puces IA sont passées d’environ 22 milliards de dollars en 2024 à environ 52 milliards de dollars en 2025, et les dépenses HBM à elles seules représentent environ 20 milliards de dollars de cette hausse

Pression sur les coûts en 2026

La HBM pourrait représenter une part encore plus importante des coûts en 2026, dans un contexte de pénurie d’approvisionnement et de hausse des prix
Les prévisions de 190 milliards de dollars de dépenses d’investissement pour l’exercice 2026 de Microsoft incluent environ 25 milliards de dollars liés à la hausse des prix des composants
Meta a relevé de 10 milliards de dollars sa fourchette de dépenses d’investissement pour 2026 en invoquant des prix de composants plus élevés

Méthode de calcul et périmètre des données

Pour chaque puce IA conçue par Nvidia, AMD, Google et Amazon, une estimation du coût par puce a été réalisée pour la mémoire, les logic dies, le packaging avancé et les composants auxiliaires
Le coût des composants de chaque puce a été multiplié par les volumes de production trimestriels estimés afin de calculer les dépenses totales par catégorie, puis la part de chaque catégorie dans les dépenses totales en composants entre le T1 2024 et le T4 2025 a été calculée
Les estimations de coût des composants proviennent de AI Chip Components explorer ; les nomenclatures de composants par puce ont été établies à partir des publications financières, de documents fournisseurs et de rapports d’analystes
La méthodologie détaillée est disponible dans la documentation méthodologique de l’explorer

Catégories de composants

Mémoire
- Comprend les stacks HBM, notamment HBM3 et HBM3e
Logique
- Comprend des logic dies gravés en procédé avancé 3 à 5 nm
Packaging
- Comprend le packaging avancé CoWoS de TSMC
Composants auxiliaires
- Comprend les substrats, l’alimentation électrique et d’autres éléments d’entrée ni logiques ni mémoire

Traitement des incertitudes

Les coûts unitaires des différents composants, comme le prix des stacks HBM, des logic dies ou des boîtiers CoWoS, comportent une incertitude sur les coûts
Les coûts par composant de chaque puce sont modélisés avec un intervalle de confiance de 90 %
La part d’un composant est le rapport entre le coût de ce composant et le coût total ; le numérateur comme le dénominateur sont donc incertains
Deux types de fourchettes sont présentés
- Fourchette où seul le coût du composant concerné varie : part obtenue lorsque ce composant est au 5e ou au 95e percentile, et que les trois autres restent à leur médiane
- Fourchette où tous les composants évoluent vers des extrêmes : part obtenue lorsque le composant concerné est à une extrémité de son intervalle de confiance et que tous les autres composants sont simultanément à l’extrémité opposée

Part trimestrielle des composants

T1 2024
- La part de la mémoire était de 52 % ; elle se situait entre 48 et 56 % si seul le coût de ce composant variait, et entre 42 et 62 % si tous les composants variaient vers des extrêmes
- La part de la logique était de 14 % ; elle se situait entre 12 et 17 % si seul le coût de ce composant variait, et entre 10 et 20 % si tous les composants variaient vers des extrêmes
- La part du packaging était de 19 % ; elle se situait entre 14 et 24 % si seul le coût de ce composant variait, et entre 12 et 27 % si tous les composants variaient vers des extrêmes
- La part des composants auxiliaires était de 15 % ; elle se situait entre 13 et 18 % si seul le coût de ce composant variait, et entre 11 et 21 % si tous les composants variaient vers des extrêmes
T4 2025
- La part de la mémoire était de 63 % ; elle se situait entre 60 et 67 % si seul le coût de ce composant variait, et entre 54 et 73 % si tous les composants variaient vers des extrêmes
- La part de la logique était de 13 % ; elle se situait entre 10 et 16 % si seul le coût de ce composant variait, et entre 9 et 19 % si tous les composants variaient vers des extrêmes
- La part du packaging était de 15 % ; elle se situait entre 11 et 19 % si seul le coût de ce composant variait, et entre 9 et 22 % si tous les composants variaient vers des extrêmes
- La part des composants auxiliaires était de 10 % ; elle se situait entre 8 et 10 % si seul le coût de ce composant variait, et entre 7 et 12 % si tous les composants variaient vers des extrêmes

Hypothèses et limites

Les coûts des composants peuvent varier selon les contrats, les fournisseurs et la période, ce qui introduit une incertitude dans les estimations de coût par puce
Les estimations trimestrielles des volumes de production et de la composition des types de puces comportent aussi une incertitude, qui est reflétée dans les parts publiées

Données et outil d’exploration

AI chip component cost shares by quarter : CSV, mis à jour le 21 mai 2026
AI Chip Components : outil d’exploration des données de consommation de la chaîne d’approvisionnement des puces IA

1 commentaires

GN⁺ 2026-05-25

Avis Hacker News

L’inférence et l’entraînement en IA semblent avoir une trajectoire qui permettrait de réduire d’environ 3x le coût matériel et d’environ 2x le coût total, même sans aucune innovation technologique
Il suffirait que l’offre de DRAM rattrape la demande ; qu’il s’agisse d’une expansion de la production ou simplement d’absorber le pic de demande au rythme actuel, ce n’est qu’une question de temps
- En tenant compte même des marges de Nvidia dues à la rareté actuelle des puces de pointe, la marge de baisse des coûts pourrait être bien plus importante
  Il y a beaucoup de choses à critiquer dans les éléments de langage que Sam Altman a diffusés culturellement, mais sur le long terme, l’idée que « c’est le pire moment de toute la période à venir » me paraît être un point assez intéressant et sous-estimé
  Dans 10 ans, entraîner des LLM au niveau actuel sera probablement aussi banal que faire tourner une base de données aujourd’hui. Le niveau actuel est déjà très avancé, et même indépendamment des progrès matériels, il reste beaucoup de potentiel de hausse rien qu’avec de meilleurs systèmes d’entraînement par apprentissage par renforcement
  Je recommande vivement de regarder les projets GitHub et HF de l’Allen Institute. On y trouve des ressources open source pour entraîner des LLM from scratch avec Common Crawl, ainsi que des ajustements intéressants autour de qwen, ce qui donne un aperçu de ce à quoi pourraient bientôt ressembler des projets d’après-midi ou des supports pédagogiques
- Les fabricants de mémoire n’augmenteront probablement pas fortement l’offre pour suivre la demande
  Ce secteur a tendance à maintenir le marché en pénurie d’offre, sinon la surcapacité qui suit finit par détruire les acteurs. À la place, l’offre sera simplement réallouée depuis des segments moins rentables comme le mobile et l’informatique personnelle vers des segments plus profitables
- Le coup très habile par lequel Sam Altman voulait prendre le contrôle du marché de la mémoire semble avoir produit des conséquences inattendues
- Je me demande si l’adoption de formats en virgule flottante alternatifs va augmenter
  La virgule flottante IEEE est notoirement mauvaise à faible largeur de bits, surtout à 16 bits ou moins. Des formats comme posit sont bien meilleurs en 16 bits ou 8 bits. Si on peut entraîner en 16 bits par valeur au lieu de 32, avec une perte de précision bien plus faible qu’en passant de l’IEEE32 à l’IEEE16, c’est potentiellement très important
- Je me demande quelle est la durée de vie et la possibilité de reconditionnement des équipements d’investissement comme les modules « GPU » ou la DRAM soudée dessus
Il y a quelques années, j’ai acheté 96 Go de RAM pour environ 250 dollars ; aujourd’hui, la même RAM coûte 1 200 dollars
- Le 22 octobre de l’an dernier, j’ai acheté un kit Crucial 96GB DDR5 5600MHz SO-DIMM RAM à 279 dollars
  Sur Amazon, le même kit est maintenant à 1 048,90 dollars
- Je suis vraiment furieux de ne pas avoir rempli mon serveur principal au maximum quand j’en avais l’occasion
  Les modules mémoire enterprise d’occasion étaient vraiment donnés sur eBay
- Il y a un an, j’ai acheté 192GB DDR3 littéralement pour 60 dollars, soit 5 dollars par module
  Maintenant c’est autour de 22 dollars par module, donc environ 350 dollars au total. Je ne sais vraiment pas qui fait quoi avec de la DDR3
- L’hypothèse selon laquelle on pouvait obtenir des dizaines de Go de RAM à bas prix est totalement cassée
  La valeur de SSD ultra-rapides comme Optane pourrait fortement augmenter
- En rangeant le garage, j’ai retrouvé deux Samsung EVO 4TB inutilisés
Dans tout ce que je lis, la capacité RAM semble devoir augmenter d’environ 20 à 25 % par an, mais ça ne paraît pas suffisant
Même pour le grand public, les téléphones et les laptops seraient nettement meilleurs avec deux fois plus de RAM, sans même parler de l’énorme demande liée à l’IA
Cette tendance ne semble pas près de disparaître. Elle ne croîtra peut-être pas aussi vite qu’aujourd’hui, mais elle ne va pas s’éteindre non plus. Je comprends pourquoi les fabricants de mémoire ne veulent pas se mettre eux-mêmes en faillite, mais il faudrait trouver un moyen de transférer ce risque vers les fournisseurs de modèles ou d’autres acteurs de l’écosystème afin d’augmenter la capacité RAM de près de 50 % par an
- Rien que les contrats d’OpenAI pourraient absorber deux années d’une telle croissance
  Sur un marché concurrentiel, il est inefficace que les fabricants de RAM ne vendent pas alors qu’il reste des acheteurs
  Je ne sais pas quel était réellement le taux de croissance avant octobre, mais quelqu’un ici doit sûrement le savoir
- Le plus grand risque, c’est que le camp chinois de CXML en profite, s’empare du marché laissé de côté par les autres, puis commence à faire pression sur les acteurs en place lorsque les coûts reviendront à la normale
  Quant à l’idée que 20 à 25 % de croissance ne suffisent pas, ce n’est pas si déconnecté si l’on suppose que les plans d’expansion des data centers vont buter contre un mur et ralentir fortement, et que la fièvre de l’IA va retomber
  À court terme, 20 à 25 % pourraient ne pas suffire, mais si l’expansion IA s’arrête cette année, on passera non pas à une pénurie, mais à une énorme surcapacité
- En théorie, un nouveau marché à terme sur les composants de puces pourrait aider
  Cela permettrait aux fournisseurs de DRAM de couvrir ce risque
- Selon un article récent, la HBM est 3 fois moins efficace que la LPDDR en surface de wafer, mais offre plus de 3 fois la bande passante
  Et si tout le monde achetait, mettons, un tiers moins d’ordinateurs rapides et passait entièrement à la HBM ?
  L’écart entre puissance de calcul et mémoire se creuse depuis longtemps, et peut-être qu’un passage, même douloureux, à la HBM est exactement ce qu’il faut
  Vaut-il mieux avoir trois ordinateurs intermédiaires à faible bande passante mémoire, ou attendre statistiquement un peu plus longtemps pour que tout le monde achète de nouveaux ordinateurs à un tiers de la vitesse en proportion de surface, mais avec une bande passante bien supérieure ?
Vu la tendance actuelle, je me demande vraiment comment on va absorber les marchés grand public comme le jeu vidéo ou le machine learning
Le cloud gaming finira clairement par arriver, et seuls des puristes comme moi paieront sans doute le premium d’une RTX 5090 pour jouer hors ligne
- À long terme, le cloud gaming est inévitable
  Parce qu’il est économiquement plus efficace d’amortir le coût du matériel nécessaire au rendu graphique entre plusieurs consommateurs, de ne pas le laisser inactif lorsqu’il n’est pas utilisé, et de le déployer dans des POP avec les assets de jeu
  Si suffisamment de calcul de jeu tourne à l’edge, on pourra aussi avoir des jeux techniquement plus avancés qui ne sont pas économiquement viables aujourd’hui. S’il n’y en a pas beaucoup pour l’instant, c’est probablement surtout à cause de la faiblesse du marché et de l’adoption du cloud gaming, ainsi que du manque de savoir-faire technique qui en découle
  Dès qu’il deviendra trop coûteux de supporter sur du matériel grand public le rendu des jeux que les gens veulent, même les derniers réfractaires finiront probablement par être convaincus et ce modèle s’imposera
Tant que les prix ne seront pas revenus au moins partiellement à la normale, je ne quitterai pas ma config DDR4
J’ai encore 32 Go de DDR4 2133MHz de secours achetés il y a longtemps, et j’utilise actuellement de la 3200MHz. Cela veut aussi dire que les fabricants de CPU n’auront pas mon argent. Le 5800X me suffit encore pour un bon moment, et je n’ai aucune raison d’acheter un nouveau GPU. Bien sûr, le B580 n’est pas parfait
- Et si c’était maintenant le prix le plus bas de tout le futur ?
Il est très ironique que l’Iran ait bloqué l’approvisionnement en hélium
En même temps, l’Iran s’appuie sur de la propagande bas de gamme produite par l’IA pour déstabiliser ses ennemis. On dirait une de ces ironies que l’histoire révèle avec retard
C’est vraiment une période terrible pour les gamers et les passionnés de PC qui ne sont pas complètement happés par l’IA
- Ça va tuer à 100 % le marché du PC assemblé à la maison
  Quand j’ai commencé à monter des PC de jeu, la meilleure carte graphique coûtait 750 dollars néo-zélandais. Aujourd’hui, il faut 10 000 dollars rien que pour le GPU, plus encore 1 000 à 2 000 dollars pour la RAM
  Avant, le PC gaming était un hobby abordable ; maintenant, l’aviation de loisir paraît presque être l’alternative
- Je pense plutôt l’inverse
  À court terme, oui, les amateurs sont sous pression, mais le capital nécessaire pour pousser la pointe de la technologie reste faible comparé à celui des entreprises du Fortune 500. Les amateurs devraient bientôt en profiter eux aussi, surtout si le marché s’effondre
- C’est aussi une période terrible pour ceux qui sont complètement happés par l’IA
Je me demande pourquoi les hyperscalers ne font pas davantage de verticalisation en construisant leurs propres fabs
Même si une fab coûtait 1 milliard de dollars, ils dépensent actuellement des centaines de milliards pour acheter des puces à Nvidia et à d’autres
- Je ne sais pas s’il faut absolument aller jusqu’à la verticalisation, et il serait peut-être préférable de financer directement des extensions de capacité de production, comme Apple lorsqu’il augmente la production de nouvelles technologies pour l’iPhone
  Mais le fait que les hyperscalers et les entreprises d’IA ne le fassent pas en dit long sur le degré réel de confiance qu’ils ont dans la demande future pour l’IA
  Les entreprises d’IA affirment qu’une énorme montée en puissance est nécessaire, mais elles ne veulent pas assumer le risque en capital que cela implique
  On entend beaucoup de lamentations côté IA sur le fait que les fabricants de puces les freinent, mais qui a réellement l’argent pour financer facilement cette expansion ? Les fabricants de puces jouent à ce jeu depuis bien plus longtemps. Quand Sam Altman allait partout en disant qu’il fallait 7 000 milliards de dollars de fabs, les entreprises d’IA ont montré qu’elles étaient prêtes à avancer des affirmations absurdes et ont perdu en crédibilité
  Ce qu’il faut maintenant, c’est qu’elles injectent directement dans le financement des fabs une toute petite partie de l’énorme trésorerie qu’elles ont accumulée
- Les fabs font partie des technologies de pointe les plus complexes qui existent
  C’est le genre de domaine qui correspond à la « science des fusées » d’aujourd’hui, et ce n’est pas une question d’argent uniquement. On peut très bien brûler des milliards sans aucun résultat
  Il suffit de voir à quel point Intel a peiné face à la concurrence ces dernières années. C’est pourtant une entreprise qui fait ce métier depuis des décennies
- Même avec le savoir-faire nécessaire, construire une fab prend des années
  Sans ce savoir-faire, il faut encore davantage d’expérimentations avant même de pouvoir concurrencer les fabricants existants. Au moment où l’on serait capable de produire des puces correctes, la pénurie pourrait déjà être terminée
- Les marges moyennes des fabs sont très faibles comparées à celles des big techs, et le risque est élevé en conséquence
  Ce n’est probablement pas le type d’activité qu’elles veulent intégrer
- Une seule fab coûte 15 à 20 milliards de dollars et prend au moins 5 ans à construire
  En plus, elle exige une expertise qu’aucune de ces entreprises ne possède
J’ai acheté un serveur Dell d’occasion il y a une semaine
Le prix de la machine complète avec un CPU 12 cœurs et 32 Go de RAM DDR4 ECC était proche du prix de seulement 64 Go de DDR RAM. J’espère que cette situation absurde prendra vite fin. Sinon, la douleur va se propager à d’autres marchés. J’ai lu récemment que les ventes de boîtiers PC avaient chuté de plus de 40 %
- À cause de la hausse des prix unitaires de la RAM, les plus pauvres sont déjà exclus même du marché des smartphones d’entrée de gamme
  https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
- J’ai le sentiment qu’au moment où la bulle de l’IA éclatera, le marché du PC sera irrémédiablement détruit
  Les fabricants qui produisaient des composants « enterprise » ne reviendront pas au marché des composants grand public. D’ici là, ce marché n’existera plus
  Et si l’on se retrouve avec un excès de data centers incapables de rentabiliser leurs productions de basse qualité, ils seront réaffectés à des usages SaaS. Un peu comme si OnShape s’étendait à toutes les applications
  La plupart des utilisateurs semblent assez indifférents à l’idée que tout ce qu’ils produisent soit stocké dans des services cloud, et cela peut facilement être vendu comme alternative à la possession d’un matériel desktop ou laptop « coûteux »
- On peut voir les choses autrement
  Si les hyperscalers utilisent plus de RAM et que cette RAM n’arrive pas jusqu’aux consommateurs, cela veut dire que toutes les tâches lourdes se feront dans le cloud
  Pourquoi faudrait-il que les hyperscalers et les consommateurs aient tous deux la RAM ? Les consommateurs voudront plus de RAM pour exécuter des modèles en local, mais dans ce cas la capacité des hyperscalers resterait inutilisée
Les fabricants de mémoire détiennent des montagnes de propriété intellectuelle
Donc même si quelqu’un disposait de capacité de fab excédentaire et voulait se lancer dans la fabrication de mémoire, il devrait affronter d’énormes barrières de brevets
La plupart des entreprises du secteur de la mémoire ont des accords de coulisse qui neutralisent mutuellement leurs violations de brevets respectives
Je vois mal comment un nouveau fabricant de mémoire pourrait émerger sans être englouti par les coûts de licence

La mémoire représente désormais près des deux tiers du coût des composants des puces IA

Principaux changements

Pression sur les coûts en 2026

Méthode de calcul et périmètre des données

Catégories de composants

Mémoire

Logique

Packaging

Composants auxiliaires

Traitement des incertitudes

Part trimestrielle des composants

T1 2024

T4 2025

Hypothèses et limites

Données et outil d’exploration

À lire aussi

1 commentaires

Avis Hacker News