- La HBM est passée de 52 % au T1 2024 à 63 % au T4 2025 selon la moyenne pondérée par les volumes de production des puces IA de Nvidia, AMD, Google et Amazon
- Sur la même période, la part des logic dies est restée presque stable à environ 13 %, tandis que le packaging avancé est passé de 19 % à 15 % et les composants auxiliaires de 15 % à 9 %
- Les dépenses en HBM des quatre concepteurs sont passées d’environ 12 milliards de dollars en 2024 à 32 milliards de dollars en 2025, avec une croissance annuelle plus rapide que celle des autres composants
- Les dépenses totales en composants de puces IA sont passées d’environ 22 milliards de dollars à 52 milliards de dollars, et la seule HBM représente environ 20 milliards de dollars de cette hausse
- En 2026, la pression sur les coûts pourrait encore s’accentuer avec la pénurie de mémoire et la hausse des prix, tandis que Microsoft et Meta ont aussi cité la hausse des prix des composants comme facteur d’augmentation de leurs dépenses d’investissement
Principaux changements
- La part de la mémoire à large bande passante (HBM) dans les dépenses en composants de puces IA est passée de 52 % au T1 2024 à 63 % au T4 2025
- Cette estimation correspond à une moyenne pondérée par les volumes de production sur l’ensemble des puces IA conçues par Nvidia, AMD, Google et Amazon
- Sur la même période, les logic dies sont restés presque inchangés autour de 13 %, tandis que le packaging avancé est passé de 19 % à 15 % et les composants auxiliaires de 15 % à 9 %
- Les dépenses en HBM des quatre concepteurs sont passées d’environ 12 milliards de dollars en 2024 à 32 milliards de dollars en 2025, avec une progression annuelle plus rapide que celle des autres composants
- Les dépenses totales en composants de puces IA sont passées d’environ 22 milliards de dollars en 2024 à environ 52 milliards de dollars en 2025, et les dépenses HBM à elles seules représentent environ 20 milliards de dollars de cette hausse
Pression sur les coûts en 2026
- La HBM pourrait représenter une part encore plus importante des coûts en 2026, dans un contexte de pénurie d’approvisionnement et de hausse des prix
- Les prévisions de 190 milliards de dollars de dépenses d’investissement pour l’exercice 2026 de Microsoft incluent environ 25 milliards de dollars liés à la hausse des prix des composants
- Meta a relevé de 10 milliards de dollars sa fourchette de dépenses d’investissement pour 2026 en invoquant des prix de composants plus élevés
Méthode de calcul et périmètre des données
- Pour chaque puce IA conçue par Nvidia, AMD, Google et Amazon, une estimation du coût par puce a été réalisée pour la mémoire, les logic dies, le packaging avancé et les composants auxiliaires
- Le coût des composants de chaque puce a été multiplié par les volumes de production trimestriels estimés afin de calculer les dépenses totales par catégorie, puis la part de chaque catégorie dans les dépenses totales en composants entre le T1 2024 et le T4 2025 a été calculée
- Les estimations de coût des composants proviennent de AI Chip Components explorer ; les nomenclatures de composants par puce ont été établies à partir des publications financières, de documents fournisseurs et de rapports d’analystes
- La méthodologie détaillée est disponible dans la documentation méthodologique de l’explorer
Catégories de composants
-
Mémoire
- Comprend les stacks HBM, notamment HBM3 et HBM3e
-
Logique
- Comprend des logic dies gravés en procédé avancé 3 à 5 nm
-
Packaging
- Comprend le packaging avancé CoWoS de TSMC
-
Composants auxiliaires
- Comprend les substrats, l’alimentation électrique et d’autres éléments d’entrée ni logiques ni mémoire
Traitement des incertitudes
- Les coûts unitaires des différents composants, comme le prix des stacks HBM, des logic dies ou des boîtiers CoWoS, comportent une incertitude sur les coûts
- Les coûts par composant de chaque puce sont modélisés avec un intervalle de confiance de 90 %
- La part d’un composant est le rapport entre le coût de ce composant et le coût total ; le numérateur comme le dénominateur sont donc incertains
- Deux types de fourchettes sont présentés
- Fourchette où seul le coût du composant concerné varie : part obtenue lorsque ce composant est au 5e ou au 95e percentile, et que les trois autres restent à leur médiane
- Fourchette où tous les composants évoluent vers des extrêmes : part obtenue lorsque le composant concerné est à une extrémité de son intervalle de confiance et que tous les autres composants sont simultanément à l’extrémité opposée
Part trimestrielle des composants
-
T1 2024
- La part de la mémoire était de 52 % ; elle se situait entre 48 et 56 % si seul le coût de ce composant variait, et entre 42 et 62 % si tous les composants variaient vers des extrêmes
- La part de la logique était de 14 % ; elle se situait entre 12 et 17 % si seul le coût de ce composant variait, et entre 10 et 20 % si tous les composants variaient vers des extrêmes
- La part du packaging était de 19 % ; elle se situait entre 14 et 24 % si seul le coût de ce composant variait, et entre 12 et 27 % si tous les composants variaient vers des extrêmes
- La part des composants auxiliaires était de 15 % ; elle se situait entre 13 et 18 % si seul le coût de ce composant variait, et entre 11 et 21 % si tous les composants variaient vers des extrêmes
-
T4 2025
- La part de la mémoire était de 63 % ; elle se situait entre 60 et 67 % si seul le coût de ce composant variait, et entre 54 et 73 % si tous les composants variaient vers des extrêmes
- La part de la logique était de 13 % ; elle se situait entre 10 et 16 % si seul le coût de ce composant variait, et entre 9 et 19 % si tous les composants variaient vers des extrêmes
- La part du packaging était de 15 % ; elle se situait entre 11 et 19 % si seul le coût de ce composant variait, et entre 9 et 22 % si tous les composants variaient vers des extrêmes
- La part des composants auxiliaires était de 10 % ; elle se situait entre 8 et 10 % si seul le coût de ce composant variait, et entre 7 et 12 % si tous les composants variaient vers des extrêmes
Hypothèses et limites
- Les coûts des composants peuvent varier selon les contrats, les fournisseurs et la période, ce qui introduit une incertitude dans les estimations de coût par puce
- Les estimations trimestrielles des volumes de production et de la composition des types de puces comportent aussi une incertitude, qui est reflétée dans les parts publiées
Données et outil d’exploration
- AI chip component cost shares by quarter : CSV, mis à jour le 21 mai 2026
- AI Chip Components : outil d’exploration des données de consommation de la chaîne d’approvisionnement des puces IA
1 commentaires
Avis Hacker News
L’inférence et l’entraînement en IA semblent avoir une trajectoire qui permettrait de réduire d’environ 3x le coût matériel et d’environ 2x le coût total, même sans aucune innovation technologique
Il suffirait que l’offre de DRAM rattrape la demande ; qu’il s’agisse d’une expansion de la production ou simplement d’absorber le pic de demande au rythme actuel, ce n’est qu’une question de temps
Il y a beaucoup de choses à critiquer dans les éléments de langage que Sam Altman a diffusés culturellement, mais sur le long terme, l’idée que « c’est le pire moment de toute la période à venir » me paraît être un point assez intéressant et sous-estimé
Dans 10 ans, entraîner des LLM au niveau actuel sera probablement aussi banal que faire tourner une base de données aujourd’hui. Le niveau actuel est déjà très avancé, et même indépendamment des progrès matériels, il reste beaucoup de potentiel de hausse rien qu’avec de meilleurs systèmes d’entraînement par apprentissage par renforcement
Je recommande vivement de regarder les projets GitHub et HF de l’Allen Institute. On y trouve des ressources open source pour entraîner des LLM from scratch avec Common Crawl, ainsi que des ajustements intéressants autour de qwen, ce qui donne un aperçu de ce à quoi pourraient bientôt ressembler des projets d’après-midi ou des supports pédagogiques
Ce secteur a tendance à maintenir le marché en pénurie d’offre, sinon la surcapacité qui suit finit par détruire les acteurs. À la place, l’offre sera simplement réallouée depuis des segments moins rentables comme le mobile et l’informatique personnelle vers des segments plus profitables
La virgule flottante IEEE est notoirement mauvaise à faible largeur de bits, surtout à 16 bits ou moins. Des formats comme posit sont bien meilleurs en 16 bits ou 8 bits. Si on peut entraîner en 16 bits par valeur au lieu de 32, avec une perte de précision bien plus faible qu’en passant de l’IEEE32 à l’IEEE16, c’est potentiellement très important
Il y a quelques années, j’ai acheté 96 Go de RAM pour environ 250 dollars ; aujourd’hui, la même RAM coûte 1 200 dollars
Sur Amazon, le même kit est maintenant à 1 048,90 dollars
Les modules mémoire enterprise d’occasion étaient vraiment donnés sur eBay
Maintenant c’est autour de 22 dollars par module, donc environ 350 dollars au total. Je ne sais vraiment pas qui fait quoi avec de la DDR3
La valeur de SSD ultra-rapides comme Optane pourrait fortement augmenter
Dans tout ce que je lis, la capacité RAM semble devoir augmenter d’environ 20 à 25 % par an, mais ça ne paraît pas suffisant
Même pour le grand public, les téléphones et les laptops seraient nettement meilleurs avec deux fois plus de RAM, sans même parler de l’énorme demande liée à l’IA
Cette tendance ne semble pas près de disparaître. Elle ne croîtra peut-être pas aussi vite qu’aujourd’hui, mais elle ne va pas s’éteindre non plus. Je comprends pourquoi les fabricants de mémoire ne veulent pas se mettre eux-mêmes en faillite, mais il faudrait trouver un moyen de transférer ce risque vers les fournisseurs de modèles ou d’autres acteurs de l’écosystème afin d’augmenter la capacité RAM de près de 50 % par an
Sur un marché concurrentiel, il est inefficace que les fabricants de RAM ne vendent pas alors qu’il reste des acheteurs
Je ne sais pas quel était réellement le taux de croissance avant octobre, mais quelqu’un ici doit sûrement le savoir
Quant à l’idée que 20 à 25 % de croissance ne suffisent pas, ce n’est pas si déconnecté si l’on suppose que les plans d’expansion des data centers vont buter contre un mur et ralentir fortement, et que la fièvre de l’IA va retomber
À court terme, 20 à 25 % pourraient ne pas suffire, mais si l’expansion IA s’arrête cette année, on passera non pas à une pénurie, mais à une énorme surcapacité
Cela permettrait aux fournisseurs de DRAM de couvrir ce risque
Et si tout le monde achetait, mettons, un tiers moins d’ordinateurs rapides et passait entièrement à la HBM ?
L’écart entre puissance de calcul et mémoire se creuse depuis longtemps, et peut-être qu’un passage, même douloureux, à la HBM est exactement ce qu’il faut
Vaut-il mieux avoir trois ordinateurs intermédiaires à faible bande passante mémoire, ou attendre statistiquement un peu plus longtemps pour que tout le monde achète de nouveaux ordinateurs à un tiers de la vitesse en proportion de surface, mais avec une bande passante bien supérieure ?
Vu la tendance actuelle, je me demande vraiment comment on va absorber les marchés grand public comme le jeu vidéo ou le machine learning
Le cloud gaming finira clairement par arriver, et seuls des puristes comme moi paieront sans doute le premium d’une RTX 5090 pour jouer hors ligne
Parce qu’il est économiquement plus efficace d’amortir le coût du matériel nécessaire au rendu graphique entre plusieurs consommateurs, de ne pas le laisser inactif lorsqu’il n’est pas utilisé, et de le déployer dans des POP avec les assets de jeu
Si suffisamment de calcul de jeu tourne à l’edge, on pourra aussi avoir des jeux techniquement plus avancés qui ne sont pas économiquement viables aujourd’hui. S’il n’y en a pas beaucoup pour l’instant, c’est probablement surtout à cause de la faiblesse du marché et de l’adoption du cloud gaming, ainsi que du manque de savoir-faire technique qui en découle
Dès qu’il deviendra trop coûteux de supporter sur du matériel grand public le rendu des jeux que les gens veulent, même les derniers réfractaires finiront probablement par être convaincus et ce modèle s’imposera
Tant que les prix ne seront pas revenus au moins partiellement à la normale, je ne quitterai pas ma config DDR4
J’ai encore 32 Go de DDR4 2133MHz de secours achetés il y a longtemps, et j’utilise actuellement de la 3200MHz. Cela veut aussi dire que les fabricants de CPU n’auront pas mon argent. Le 5800X me suffit encore pour un bon moment, et je n’ai aucune raison d’acheter un nouveau GPU. Bien sûr, le B580 n’est pas parfait
Il est très ironique que l’Iran ait bloqué l’approvisionnement en hélium
En même temps, l’Iran s’appuie sur de la propagande bas de gamme produite par l’IA pour déstabiliser ses ennemis. On dirait une de ces ironies que l’histoire révèle avec retard
C’est vraiment une période terrible pour les gamers et les passionnés de PC qui ne sont pas complètement happés par l’IA
Quand j’ai commencé à monter des PC de jeu, la meilleure carte graphique coûtait 750 dollars néo-zélandais. Aujourd’hui, il faut 10 000 dollars rien que pour le GPU, plus encore 1 000 à 2 000 dollars pour la RAM
Avant, le PC gaming était un hobby abordable ; maintenant, l’aviation de loisir paraît presque être l’alternative
À court terme, oui, les amateurs sont sous pression, mais le capital nécessaire pour pousser la pointe de la technologie reste faible comparé à celui des entreprises du Fortune 500. Les amateurs devraient bientôt en profiter eux aussi, surtout si le marché s’effondre
Je me demande pourquoi les hyperscalers ne font pas davantage de verticalisation en construisant leurs propres fabs
Même si une fab coûtait 1 milliard de dollars, ils dépensent actuellement des centaines de milliards pour acheter des puces à Nvidia et à d’autres
Mais le fait que les hyperscalers et les entreprises d’IA ne le fassent pas en dit long sur le degré réel de confiance qu’ils ont dans la demande future pour l’IA
Les entreprises d’IA affirment qu’une énorme montée en puissance est nécessaire, mais elles ne veulent pas assumer le risque en capital que cela implique
On entend beaucoup de lamentations côté IA sur le fait que les fabricants de puces les freinent, mais qui a réellement l’argent pour financer facilement cette expansion ? Les fabricants de puces jouent à ce jeu depuis bien plus longtemps. Quand Sam Altman allait partout en disant qu’il fallait 7 000 milliards de dollars de fabs, les entreprises d’IA ont montré qu’elles étaient prêtes à avancer des affirmations absurdes et ont perdu en crédibilité
Ce qu’il faut maintenant, c’est qu’elles injectent directement dans le financement des fabs une toute petite partie de l’énorme trésorerie qu’elles ont accumulée
C’est le genre de domaine qui correspond à la « science des fusées » d’aujourd’hui, et ce n’est pas une question d’argent uniquement. On peut très bien brûler des milliards sans aucun résultat
Il suffit de voir à quel point Intel a peiné face à la concurrence ces dernières années. C’est pourtant une entreprise qui fait ce métier depuis des décennies
Sans ce savoir-faire, il faut encore davantage d’expérimentations avant même de pouvoir concurrencer les fabricants existants. Au moment où l’on serait capable de produire des puces correctes, la pénurie pourrait déjà être terminée
Ce n’est probablement pas le type d’activité qu’elles veulent intégrer
En plus, elle exige une expertise qu’aucune de ces entreprises ne possède
J’ai acheté un serveur Dell d’occasion il y a une semaine
Le prix de la machine complète avec un CPU 12 cœurs et 32 Go de RAM DDR4 ECC était proche du prix de seulement 64 Go de DDR RAM. J’espère que cette situation absurde prendra vite fin. Sinon, la douleur va se propager à d’autres marchés. J’ai lu récemment que les ventes de boîtiers PC avaient chuté de plus de 40 %
https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
Les fabricants qui produisaient des composants « enterprise » ne reviendront pas au marché des composants grand public. D’ici là, ce marché n’existera plus
Et si l’on se retrouve avec un excès de data centers incapables de rentabiliser leurs productions de basse qualité, ils seront réaffectés à des usages SaaS. Un peu comme si OnShape s’étendait à toutes les applications
La plupart des utilisateurs semblent assez indifférents à l’idée que tout ce qu’ils produisent soit stocké dans des services cloud, et cela peut facilement être vendu comme alternative à la possession d’un matériel desktop ou laptop « coûteux »
Si les hyperscalers utilisent plus de RAM et que cette RAM n’arrive pas jusqu’aux consommateurs, cela veut dire que toutes les tâches lourdes se feront dans le cloud
Pourquoi faudrait-il que les hyperscalers et les consommateurs aient tous deux la RAM ? Les consommateurs voudront plus de RAM pour exécuter des modèles en local, mais dans ce cas la capacité des hyperscalers resterait inutilisée
Les fabricants de mémoire détiennent des montagnes de propriété intellectuelle
Donc même si quelqu’un disposait de capacité de fab excédentaire et voulait se lancer dans la fabrication de mémoire, il devrait affronter d’énormes barrières de brevets
La plupart des entreprises du secteur de la mémoire ont des accords de coulisse qui neutralisent mutuellement leurs violations de brevets respectives
Je vois mal comment un nouveau fabricant de mémoire pourrait émerger sans être englouti par les coûts de licence