xAI se rapproche davantage d’une activité de location de datacenters (REIT) que d’un laboratoire frontier
(martinalderson.com)- Ces dernières semaines, xAI a signé coup sur coup des contrats de location de capacités GPU massives à Anthropic et Google, évoluant vers un profil plus proche d’un loueur d’infrastructure que d’un développeur de modèles
- En février, xAI a fusionné avec SpaceX, créant une structure où les revenus locatifs affluent directement vers l’entité appelée à être cotée
- Pour Anthropic, l’accord atteint 1,25 Md$/mois pour 300 MW (environ 220 000 GPU), et pour Google 920 M$/mois pour 110 000 GPU ; si ces contrats durent 18 mois, ils pourraient permettre de récupérer l’intégralité des quelque 40 Md$ de coûts de construction
- La pénurie extrême de GPU et la capacité de SpaceX/xAI à construire rapidement des datacenters constituent le véritable avantage concurrentiel derrière ces accords
- Une capacité initialement destinée à Grok, le modèle maison, est louée à des concurrents directs, liant un possible recul dans la course des laboratoires frontier au succès ou à l’échec de la plus grande IPO de l’histoire de l’Amérique du Nord
Structure des contrats et contexte de la fusion avec SpaceX
- xAI a récemment conclu des partenariats de fourniture de capacités GPU à grande échelle avec Anthropic et Google
- En février, xAI a fusionné avec SpaceX, de sorte que les revenus de ces contrats alimentent directement l’entité en vue d’une introduction en Bourse
- Certains évoquent une forme d’ingénierie financière à l’approche de l’IPO de SpaceX, mais l’enjeu dépasse sans doute une simple technique comptable
Le problème de manque de capacité chez Anthropic
- Les produits Claude ont connu de graves pénuries de capacité, en particulier en début d’après-midi en Europe et le matin aux États-Unis
- C’est la plage horaire où les utilisateurs européens et américains travaillent en même temps et se disputent le plus fortement les ressources
- Anthropic a introduit des limitations aux heures de pointe dans son abonnement
- L’usage entre 5 h et 11 h PT / 13 h et 19 h GMT consomme davantage du quota disponible
- Objectif : lisser la demande entre heures de pointe et heures creuses
- Avec une demande en forte hausse, déplacer la consommation ne suffit plus, et des restrictions supplémentaires deviennent inévitables
- Une situation peu souhaitable alors que Google et OpenAI accentuent la pression pour capter les clients
Les contrats de fourniture de capacité de xAI
- Début mai, xAI a annoncé donner à Anthropic accès à l’ancien datacenter Colossus 1 situé à Memphis
- Anthropic a ainsi pu retirer ses restrictions d’usage pour les abonnés ; la stabilité du service reste imparfaite, mais le manque de capacité aux heures de pointe a été temporairement atténué
- Le contrat avec Anthropic est monté jusqu’à 300 MW de capacité pour 1,25 Md$/mois, soit environ 220 000 GPU
- La semaine dernière, Google a lui aussi annoncé un partenariat similaire : 110 000 GPU pour 920 M$/mois
- Les deux contrats incluent des clauses de résiliation
- Après une période initiale de lock-in, chaque partie peut résilier avec un préavis de 90 jours
Analyse de rentabilité
- Pris au pied de la lettre, ces contrats semblent extrêmement rentables pour xAI
- S’ils durent 18 mois, ils pourraient permettre de récupérer l’intégralité des 40 Md$ de capex, tout en laissant à xAI la possession de centaines de MW de GPU
- En revanche, les opex et l’amortissement ne sont pas inclus
- À moyen terme, la pénurie de calcul devrait probablement persister, ce qui rendrait même les anciens H100 encore très utiles dans 18 mois
-
Estimation du coût de l’électricité (opex)
- À pleine charge sur 300 MW, la consommation annuelle atteint environ 2,6 milliards de kWh
- En achetant l’électricité sur le réseau au tarif industriel bas du Tennessee (environ 0,06 $/kWh), cela représenterait environ 160 M$ par an
- Colossus fonctionne surtout avec ses propres turbines à gaz sur site ; avec un rendement thermique en cycle simple d’environ 10 000 Btu/kWh et un gaz Henry Hub à environ 3,50 $/MMBtu, le coût du carburant tomberait plutôt à environ 90 M$ par an
- Face aux quelque 15 Md$ par an versés par Anthropic pour 300 MW, l’électricité ne représente qu’environ 1 % du chiffre d’affaires
Objections et signaux d’alerte autour de ces contrats
- Elon Musk et OpenAI sont engagés dans un conflit juridique intense, et le contrat avec Anthropic pourrait viser davantage à faire pression sur OpenAI qu’à maximiser un intérêt commercial
- Google est un actionnaire important de SpaceX, ce qui crée une incitation à soutenir la valorisation de l’IPO
- Cela dit, le point essentiel reste que les GPU sont en situation de pénurie massive
- Derrière le boom des capex dans les datacenters se cache le fait que tous les acteurs ont pris un retard important sur leur calendrier
- Même Stargate UAE, le principal datacenter d’OpenAI, serait directement menacé par le conflit actuel avec l’Iran ; des drones iraniens ont déjà frappé un autre datacenter aux Émirats arabes unis
L’avantage concurrentiel de SpaceX/xAI dans la construction
- SpaceX/xAI excelle dans la capacité à construire des datacenters dans les délais
- Le premier Colossus 1 a été construit en seulement 122 jours
- L’écosystème de Musk dispose d’un avantage majeur dans la planification, la construction et l’exécution rapide de projets d’infrastructure à grande échelle
- Les hyperscalers ont eux aussi de l’expérience, mais dans des environnements moins urgents, et l’exécution d’un projet classique leur prend souvent plusieurs années
- Le boom de capex ne s’est vraiment accéléré que ces dernières années, et de nombreux projets ne doivent toujours être achevés que dans plusieurs années
- C’est un avantage concurrentiel majeur pour xAI qu’on ne peut pas balayer d’un revers de main
La position de Grok
- Une part importante de la capacité de datacenter prévue pour l’entraînement et l’inférence de Grok est louée à des concurrents directs, ce qui place Grok dans une position ambiguë
- Cela ressemble à un recul manifeste dans la compétition entre laboratoires de niveau frontier
- Il est toutefois possible que la capacité de datacenter ait été surestimée, ou que la demande d’inférence pour les modèles Grok soit restée très en dessous des prévisions, poussant xAI à monétiser une capacité excédentaire
- Le contrat entre xAI et Cursor complique encore davantage la situation
- Ingénierie financière, pénurie massive de calcul et avantage dans la construction de datacenters : les trois facteurs sont probablement réels à des degrés divers
- L’ampleur de chacun pourrait déterminer le succès ou l’échec de la plus grande IPO de l’histoire nord-américaine
- En résumé, xAI ne ressemble pas tant à un laboratoire frontier assorti d’une activité de datacenter qu’à un REIT de datacenters avec un laboratoire frontier en plus
1 commentaires
Commentaires sur Hacker News
Google détient 5 à 6 % de SpaceX. Si SpaceX vise une valorisation de 1,77 billion de dollars, la participation de Google vaudrait entre 88,5 et 106,2 milliards de dollars
Je ne suis pas sceptique à l’égard de l’IA/LLM en soi, mais ce genre de transactions circulaires paraît très suspect, et je m’inquiète de ce qui se passera quand la musique s’arrêtera
Il n’y a pas de GPU inutilisés, et dans les labos d’IA de pointe, le calcul se transforme immédiatement en argent. Il y a certes une part de transactions circulaires douteuses, mais je ne pense pas que ce cas en fasse partie
Ce n’est pas un produit spéculatif où l’on achète des jetons pour les revendre ; ici, les jetons sont consommés au moment de l’inférence
En réalité, il est difficile de savoir dans quelle mesure cette opération augmente la capitalisation de SpaceX, et sauf si Google compte céder sa participation très bientôt, parler de transaction circulaire n’a pas beaucoup de sens non plus
Je ne sais pas si le fait de passer par des actions plutôt que par de la dette vise à détourner une partie de l’enthousiasme du marché des IPO d’Anthropic et d’OpenAI, mais il sera intéressant de voir comment le marché absorbera cette nouvelle offre d’actions. Quelqu’un n’atteindra pas son objectif de financement, et ceux qui entreront en bourse plus tard pourraient en supporter le coût
Il n’y a pas si longtemps, on disait encore que la valorisation de SpaceX reposait sur une partie des bénéfices de Starlink et sur une énorme spéculation
Puis, dès qu’on a appris que Google et Anthropic apportaient 2,2 milliards de dollars par mois, soit 26 milliards de dollars de nouveaux revenus annuels, la discussion n’a pas tourné autour de ça mais a basculé vers « la technologie de xAI n’est pas terrible » ou « la structure Google/SpaceX est mauvaise pour l’économie »
C’est du raisonnement motivé. Quand de nouvelles informations arrivent, il faut mettre à jour sa conclusion précédente, mais là, on cherche simplement une autre manière de réagir négativement. Les gens qui détestent Elon/SpaceX contaminent complètement le récit
xAI semble avoir conclu que c’était la meilleure manière d’extraire de la valeur de ses actifs. Et Google comme Anthropic pensent manifestement pouvoir tirer de ces actifs plus de valeur que le loyer qu’ils versent à SpaceX
Donc cela invalide la logique spéculative, tout en montrant qu’il y a un problème du côté technologique, qui était justement au cœur de cette spéculation
Si l’on a utilisé à la fois Grok et les modèles concurrents, il est difficile de contester le point de base selon lequel Grok n’est pas aussi bon que les modèles concurrents. Que cela soit important ou non d’un point de vue business est une autre question
Mais dans ce cas précis, le changement de modèle économique modifie fondamentalement la proposition de valeur. Je ne vois pas pourquoi le récit « une entreprise spatiale qui gagne de l’argent avec le spatial se met maintenant à jouer au revendeur de capacité de calcul, et c’est une bonne chose » serait plus souhaitable
Et je n’aime pas non plus cette manière de viser indirectement un certain « récit » sans jamais le réfuter explicitement. On ne sait même pas très bien qui est ce « nous » ici, et cela donne l’impression de fabriquer un consensus qui n’existe pas
Maintenant on sait à quel prix ces GPU sont loués. Ce qui m’intéresse vraiment désormais, c’est le coût des intrants pour produire l’électricité
Est-ce qu’il reste réellement assez de marge dans ces transactions pour que xAI couvre ses coûts d’amortissement
D’après les notes, Colossus fonctionne en grande partie avec ses propres turbines à gaz sur site, et avec un rendement thermique en cycle simple d’environ 10,000 Btu/kWh et un prix du gaz Henry Hub de $3.50/MMBtu, le coût annuel du carburant serait d’environ 90 millions de dollars
C’est ridiculement bon marché. Comment est-ce que moi aussi je peux me lancer dans la location de GPU aux hyperscalers
Ce n’est pas un REIT de datacenter. Un REIT de datacenter ne vend pas du calcul ; il vend de l’espace, de l’électricité et du refroidissement pour accueillir du calcul
Je comprends l’idée de l’auteur. Il veut dire que l’actif le plus précieux de SpaceX, c’est sa capacité de calcul, mais la comparaison n’est pas très précise
Aujourd’hui, SpaceX ressemble en fait davantage à une holding qui regroupe à peu près tout ce qu’Elon possède, hors Tesla. Miser sur SpaceX, c’est miser sur un conglomérat
Avoir développé un LLM signifie bien que c’est un labo d’IA, mais à voir la qualité du modèle, ce n’est pas vraiment ce qu’on appellerait à la pointe
Chacun a ses forces et ses faiblesses et, personnellement, je trouve toujours ChatGPT meilleur, puis Gemini/Claude, puis Grok.
Pour un usage général, Grok donne souvent l’impression d’avoir 1 à 2 générations de retard sur les modèles concurrents, mais il y a trois choses que j’aime chez lui. D’abord, sa compréhension des événements récents me semble la meilleure. Je ne sais pas si c’est grâce à l’intégration avec X ou à l’optimisation des appels d’outils côté backend, mais quand on lui pose des questions sur ce qui est en train de se passer, les autres modèles ont souvent des informations obsolètes ou des réponses médiocres.
Ensuite, sur les problèmes personnels, c’est en général celui qui flatte le moins. Anthropic va aussi dans cette direction, et ChatGPT comme Gemini s’améliorent, mais les anciens modèles ne disaient presque jamais quoi que ce soit de négatif sur ce que je faisais. Quand j’ai besoin de conseils de carrière ou de conseils personnels, j’aime bien le ton des réponses de Grok.
Enfin, au travail, il existe des sujets que les autres modèles refusent de traiter. Dans mon ancienne entreprise, il y avait énormément d’utilisateurs juridiques et, quand il fallait résumer des thèmes précis à partir de transcriptions de dépositions, la plupart des modèles refusaient, alors que Grok ne refusait pas. Je comprends la nécessité de la sécurité et je ne blâme pas les autres fournisseurs, mais certains métiers spécialisés ont vraiment besoin d’un modèle capable de traiter des sujets sensibles.
Pour des cas du type « trouve-moi un dépôt GitHub qui faisait $vague_thing en 2017 », Grok trouve plus souvent l’information que je cherche.
Je ne veux pas dire que c’était intentionnel, mais en pratique l’effet a été celui-là.
Pour ça, il faut non pas un datacenter d’inférence, mais un énorme datacenter d’entraînement.
Pour ceux qui ne connaissent pas, un REIT est un real estate investment trust, c’est-à-dire une société d’investissement immobilier.
Cet article est-il une mise en forme du commentaire posté il y a deux jours par l’utilisateur HN runako[1] ?
Il est tout à fait possible que plusieurs personnes aient eu la même idée en même temps, mais si l’auteur du billet l’a posté lui-même, l’absence de mention paraît un peu impolie.
[1] https://news.ycombinator.com/threads?id=runako#48426082
La même idée est aussi apparue dans les commentaires ici il y a deux jours : https://news.ycombinator.com/item?id=48426082
Il est désormais très difficile de rattraper OpenAI et Anthropic. La boucle vertueuse consistant à générer du chiffre d’affaires, acheter plus de calcul avec ce chiffre d’affaires, puis entraîner des modèles plus intelligents avec davantage de calcul a rendu la compétition beaucoup plus difficile.
S’il n’est plus possible de rivaliser sur les LLM de pointe, alors du point de vue de SpaceXAI, il est plus logique de se placer du côté de la fourniture de calcul.
Elon est excellent sur le matériel, mais chez xAI il a procédé à des licenciements massifs à la manière de la PayPal Mafia et, comme lors du rachat de Twitter, il a essayé de réembaucher peu après, sans réussir à constituer un grand effectif d’ingénieurs logiciel.
Les accords autour des datacenters sont venus ensuite. Or quelqu’un qui promettait au monde de défendre la liberté d’expression et des systèmes d’IA « pro-humains » vend maintenant à des concurrents, tout en réduisant la limite quotidienne d’usage de sa propre app Grok d’un multiple à un seul chiffre.
Quand on fait affaire avec la personne la plus riche du monde, on peut prédire que, malgré le reste du discours, l’argent finira par passer avant les autres considérations. Cela dit, la stratégie reste intéressante.
Pour être juste, dans une interview l’an dernier, ils ont dit avoir jugé que le matériel était le « goulet d’étranglement ». Mais je reste convaincu qu’ils ont sous-estimé les problèmes logiciels. L’application avait beaucoup de problèmes, et en a encore beaucoup aujourd’hui.
xAI est une entreprise verticalement intégrée, et elle a très bien exécuté la partie calcul. Son modèle le plus avancé oscille entre le très haut du panier et 1 à 2 générations derrière les meilleurs, et sur le papier il a même été brièvement au sommet une fois.
S’ils reviennent au sommet demain, ils savent comment changer d’échelle. Si Google ou Anthropic l’acceptent, ils pourront aussi racheter les ressources qu’ils leur ont louées.