- La croissance explosive des centres de données IA fait que la demande de RAM dépasse l’offre, provoquant une pénurie mondiale de mémoire
- Le prix de la DRAM a augmenté de 50 % d’un trimestre à l’autre, et une hausse supplémentaire de 40 % est attendue au trimestre suivant, sans perspective de baisse des prix avant 2026
- De grands fabricants comme Micron Technology se concentrent sur la production de mémoire avancée pour l’IA, ce qui entraîne une baisse de l’approvisionnement en puces pour les PC, smartphones et appareils électroménagers
- Les systèmes d’entraînement et d’inférence de l’IA exigent une mémoire de grande capacité et à large bande passante, ce qui rend impossible tout ajustement de la demande à court terme
- Les experts avertissent que le goulot d’étranglement de l’offre persistera jusqu’à la mise en service de nouvelles usines en 2027 et qu’il exercera une pression à la hausse sur les prix des appareils
Pénurie mondiale de puces mémoire
- L’expansion du cloud computing et des centres de données liés à l’IA fait exploser la demande pour certaines puces mémoire, provoquant des pénuries d’approvisionnement
- Cela soulève la possibilité d’une hausse des prix pour divers appareils électroniques, notamment les smartphones, ordinateurs et consoles de jeu
- Avril Wu de TrendForce a déclaré : « Si vous voulez acheter un appareil, il faut le faire maintenant. »
- La RAM est un composant essentiel pour exécuter plusieurs applications en même temps ou assurer une lecture fluide des vidéos
- La demande dépasse l’offre d’environ 10 %, et les fabricants paient des prix plus élevés chaque mois
La flambée des prix de la DRAM
- Au quatrième trimestre 2025, le prix de la DRAM a augmenté de 50 % par rapport au trimestre précédent
- En cas de livraison anticipée, il faut payer un prix 2 à 3 fois plus élevé
- TrendForce prévoit une hausse supplémentaire de 40 % au trimestre suivant et estime qu’il n’y aura pas de baisse des prix avant 2026
- Cette flambée est principalement attribuée à la demande explosive des centres de données IA
Comment l’IA engloutit la mémoire
- Les centres de données IA ont besoin d’une grande quantité de mémoire en plus des GPU
- Sanchit Vir Gogia de Greyhound Research explique : « Les charges de travail de l’IA sont construites autour de la mémoire. »
- Les systèmes d’entraînement et d’inférence des modèles d’IA exigent une mémoire massive et continue, une bande passante élevée et une proximité avec les unités de calcul
- En raison de ces caractéristiques, réduire la demande entraîne inévitablement une baisse des performances
Réaction des fabricants et du marché
- Micron Technology, l’un des principaux fabricants mondiaux de RAM, a enregistré des résultats supérieurs aux prévisions grâce à la hausse de la demande liée à l’IA
- Son PDG, Sanjay Mehrotra, a déclaré que « la situation où l’offre ne parvient pas à suivre la demande va se prolonger »
- Les fabricants sont en train de basculer vers la production de mémoire avancée pour l’IA, ce qui réduit en conséquence l’approvisionnement en puces pour les PC, mobiles et téléviseurs
- Jeff Clarke, COO de Dell, a affirmé que « cette hausse des coûts sera répercutée sur les consommateurs »
Goulots d’étranglement de l’offre et perspectives
- Les experts soulignent qu’il n’existe pas de solution à court terme
- Les usines actuelles devraient atteindre leurs limites de capacité de production d’ici fin 2026
- La nouvelle usine de Micron dans l’Idaho doit entrer en service en 2027, ce qui laisse prévoir une poursuite des pénuries d’approvisionnement jusque-là
- En conséquence, il est très probable que les hausses de prix des fournisseurs de mémoire se poursuivent
1 commentaires
Réactions sur Hacker News
Je n’arrive pas à me défaire de l’idée que tout ce que les LLM touchent en ce moment finit par être abîmé
On peut citer les graphismes façon Ghibli, le support client, le contenu sur Internet, et même le cours de l’action Oracle
Maintenant, on dirait que cela affecte aussi les puces. On en vient à se demander s’il faudra renoncer à toute technologie pour que ça s’arrête
Au début, tout le monde les utilise maladroitement, puis on finit par trouver le bon niveau d’usage. Le problème, ce n’est pas la technologie elle-même, mais le cycle de hype excessif
Au final, les grandes entreprises vont sans doute monopoliser davantage l’attention des gens
J’essaie de moins dépendre de la technologie et de réapprendre les loisirs hors ligne ainsi que les relations humaines directes
Je compte n’utiliser Internet qu’au strict minimum, pour le travail et pour organiser des rencontres
L’IA consomme de manière inefficace des ressources de calcul limitées
Un PC gaming de milieu de gamme permet déjà d’afficher des graphismes haute résolution, d’encoder des vidéos et de faire de grosses compilations, mais avec la même machine il est difficile de faire tourner ne serait-ce qu’un LLM local ordinaire
Les modèles d’entreprises comme OpenAI ou Anthropic exigent des ressources bien plus coûteuses. Ces ressources auraient été plus utiles pour la prévision météorologique ou la recherche sur le cancer
La RAM reste à 8 Go, les CPU sont d’entrée de gamme et il n’y a pas de GPU. Pendant ce temps, les OS et les logiciels deviennent de plus en plus complexes et instables
À force de se concentrer uniquement sur l’IA, le secteur risque de faire faire un grand bond en arrière aux étudiants et aux chercheurs
Les investisseurs actuels pensent que l’IA est plus efficace pour transformer des GPU et de la RAM en argent, donc ils paient davantage pour le même matériel
On peut craindre qu’un petit nombre d’entreprises fasse monter le prix des ressources de calcul via l’IA, en excluant le reste de l’humanité du marché
Le recul du matériel grand public est net depuis deux ans
8 Go de RAM, CPU bas de gamme, pas de GPU. En parallèle, les OS deviennent lourds et instables. On a l’impression que le secteur se concentre uniquement sur l’IA
Cela risque d’être un coup dur surtout pour les étudiants et le monde scientifique
Il existe des exceptions comme Zed, mais dans l’ensemble l’optimisation passe après tout le reste
Sous Linux, la même configuration fonctionne bien plus fluidement. Ce sont les tâches inutiles en arrière-plan de Windows 11 qui posent problème
J’aimerais que Microsoft propose un mode basse configuration
En revanche, le chat YouTube a toujours de gros problèmes de fuite mémoire
Cela pourrait pousser à écrire des logiciels plus efficaces
Je pense que le gouvernement coréen devrait intervenir sur le problème de distorsion de l’approvisionnement en mémoire
SK hynix et Samsung fournissent massivement de la HBM et de la DRAM haut de gamme aux entreprises d’IA, ce qui pourrait nuire aux autres secteurs
Même en interne chez Samsung, la division MX (smartphones) n’obtient pas de la division DS (mémoire) une garantie d’approvisionnement prioritaire
C’est un signal d’alerte pour l’économie coréenne très dépendante des exportations
La pénurie de DRAM ne concerne pas seulement les PC ou les téléphones
Les voitures, les avions, le contrôle du trafic, le contrôle industriel, les infrastructures publiques — tous ces systèmes dépendent de la DRAM
On peut s’inquiéter des répercussions dans tous ces domaines
Le monde fonctionnait très bien avec de la DDR3
Heureusement, aujourd’hui un iPhone d’occasion vieux de 4 ans, un Mac de série M ou un portable Linux restent tout à fait utilisables
Ceux qui ont vraiment besoin de hautes performances seront pénalisés, mais pour la plupart des gens, repousser un achat de 1 à 2 ans reste acceptable
La discussion s’est poursuivie aussi dans ce fil
Les discours excessivement catastrophistes ne servent à rien
Si c’est une bulle, elle éclatera bientôt ; sinon, la production s’adaptera
Au final, le coût des datacenters d’IA sera payé par nous tous via des PC, portables et téléphones plus chers
Pendant ce temps, les entreprises de l’IA profiteront de contrats à bas prix
Je me demande pourquoi des fabricants de mémoire comme Crucial réduisent leurs produits grand public pour se concentrer sur l’IA
Même si la rentabilité est plus faible, il est difficile de comprendre pourquoi ils accepteraient de faire grandir des concurrents
Les puces pour l’IA sont 3 à 4 fois plus chères que celles destinées au grand public, avec de meilleures marges
Au final, la raison est la hausse du cours de l’action à court terme et la maximisation du profit. Le marché est en plus structurellement fragile, car dominé par trois grands acteurs
Les cycles de développement sont longs, la demande est incertaine et il est tout à fait possible que la fièvre autour de l’IA retombe