- Expérimentation consistant à transformer un Nvidia Grace-Hopper GH200 en AI desktop personnel, avec des performances suffisantes pour exécuter localement un modèle de 235B paramètres
- Sur Reddit, achat d’un système GH200 d’occasion pour 7 500 €, puis remontage d’un serveur de centre de données à refroidissement liquide en desktop à air
- Gestion de nombreux dépannages matériels : défaut d’affichage de la température GPU à 16 777 214 °C à cause du refroidissement, de l’alimentation et d’erreurs de capteurs, panne de circuit de ventilateurs, réparations par brasage manuel
- Réalisation finale avec 4 radiateurs AIO, adaptateurs usinés CNC et composants en impression 3D pour obtenir un système stable
- Coût total d’environ 9 000 €, ce qui permet de construire une station de travail IA hautes performances à moindre coût qu’un GPU H100 seul
Achat et spécifications du serveur Grace-Hopper
- Sur le forum r/LocalLLaMA de Reddit, repérage d’une annonce de serveur GH200 à 10 000 € puis achat après négociation à 7 500 €
- Configuration : 2× Grace-Hopper Superchip, 2× Grace CPU 72 cœurs, 2× H100 GPU, 480 Go de LPDDR5X, 96 Go de HBM3, au total 1 152 Go de mémoire haute performance
- Bande passante NVLink-C2C de 900 Go/s, puissance comprise entre 1 000 et 2 000 W, alimentation 3 000 W incluse
- Le vendeur est GPTshop.ai, une société qui convertit des serveurs Nvidia pour les vendre en desktop
- Le système était déjà une forme de « système Frankenstein » convertissant un serveur en eau en air cooling
- Boîtier rustique, impossible à monter en rack, alimentation 48 V ajoutée
Démontage et nettoyage du serveur
- Le serveur était très encrassé par la poussière, et les 8 ventilateurs haute puissance produisaient un niveau sonore comparable à celui d’un aspirateur
- Trop bruyant pour une utilisation à la maison, le démontage puis le nettoyage et le remontage ont donc été effectués
- Nettoyage complet de la carte mère avec plusieurs litres d’isopropanol, puis séchage pendant une semaine sur plaque chauffante
- Démontage des modules Grace-Hopper pour inspecter leur état interne et explorer la structure à l’intérieur
Reconfiguration du refroidissement liquide
- Pour réduire les risques de fuite, remplacement des blocs sur mesure par 4 AIO Arctic Liquid Freezer III 420
- Mesure des dimensions des dies GPU et CPU, puis conception du bloc adaptateur dans Fusion 360
- Réalisation d’un prototype avec une imprimante Bambu X1, puis passage en usinage CNC pour la pièce finale
- Retrait de l’huile résiduelle après usinage et assemblage, avec validation des performances de refroidissement
Assemblage du desktop
- Fabrication d’un châssis en ProfilAlu en aluminium, conçu via Fusion 360
- Conception et impression 3D de dizaines de pièces de montage pour PCB et filtres
- Utilisation de plusieurs kilos de filament pour rigidifier la structure
Principaux problèmes rencontrés
- Lors du branchement de l’alimentation des ventilateurs, apparition d’un bruit de « pop » et de fumée, avec dommage de certains circuits de connecteur de ventilateur
- Panne probable d’un MOSFET due à un calcul de courant incorrect
- L’alimentation des ventilateurs a été remplacée par un adaptateur 12V-5A dédié
- Les erreurs de ventilateur ont empêché le démarrage via le BMC (Baseboard Management Controller)
- Contournement du contrôle des ventilateurs en désactivant
phosphor-sensor-monitor.service
- Contournement du contrôle des ventilateurs en désactivant
Erreur de température GPU et réparation des circuits
- Au démarrage, la température GPU affichait 16 777 214 °C, provoquant l’arrêt automatique du système
- Il s’agissait de la valeur maximale d’un entier 24 bits (2²⁴-2), indiquant une erreur de signal de capteur
- Inspection au microscope : identification d’un condensateur de 100 nF et d’une résistance de 4,7 kΩ endommagés
- Réparation au soudage fin puis fixation au masque UV
- Redémarrage réussi après remontage
Configuration finale et performances
- Pièces ajoutées :
- Fixation d’un SSD E1.S 8 To, panneau arrière pour alimentation 3 kW, grille de protection pour radiateurs
- Le problème d’initialisation du GPU a été résolu par désactivation de NVLink
- Ajout de
NVreg_NvLinkDisable=1dans/etc/modprobe.d/nvidia-disable-nvlink.conf
- Ajout de
Résultats de benchmark
- Compilation de Llama.cpp en 90 s avec 144 cœurs, avec les résultats de tests de grands modèles :
- gpt-oss-120b-Q4_K_M : prompt 2974.79, tokens 195.84
- GLM-4.5-Air-Q4_K_M : prompt 1936.65, tokens 100.71
- Qwen3-235B-A22B-Instruct : prompt 1022.79, tokens 65.90
- Consommation d’environ 300 W par GPU, avec de la marge par rapport au maximum de 900 W
Détails des coûts
- Serveur Grace-Hopper : 7 500 €, SSD : 250 €, adaptateur CNC : 700 €, refroidisseurs à liquide : 180 €
- Châssis : 200 €, panneau en verre : 40 €, matériau d’impression 3D : 40 €, autres composants : 50 €
- Isopropanol pour nettoyage : 20 €, alimentation 12V : 10 €, éclairage LED : 10 €
- Total d’environ 9 000 €, inférieur au prix d’un GPU H100 seul
Conclusion
- Réalisation d’un desktop capable d’exécuter localement des modèles de 235B paramètres
- Conversion d’un matériel de centre de données pour usage personnel avec contournement de nombreux obstacles tels que erreurs de capteurs, dégâts de circuits et problèmes de refroidissement
- Résultat final : une workstation de recherche IA hautes performances bâtie à faible coût
1 commentaires
Avis sur Hacker News
J’ai acheté du matériel IA de niveau datacenter et, après une suite de galères en le modifiant de refroidissement liquide → air → de nouveau liquide, avec entre autres une température GPU affichée à 16 millions de degrés, j’ai fini par assembler un desktop capable de faire tourner un modèle de 235B paramètres à la maison
C’est l’histoire d’une décision insensée, de résolution créative de problèmes et d’une tentative de transformer du matériel de datacenter en machine du quotidien
Il m’a fallu une semaine pour trouver ça, et c’est Reddit qui m’a sauvé. Je me demande si ce genre de problème peut aussi arriver dans tous les datacenters
J’ai eu une expérience similaire. Depuis 3 ans, je voulais construire avec mon fils un serveur de jeu en rack, mais comme notre logement est petit et que ma femme n’était pas d’accord, j’ai utilisé l’installation photovoltaïque de mes parents (90 kWp) et leurs serveurs en rack
Il y a deux mois, j’ai acheté sur eBay un Supermicro SYS-7049GP-TRT pour 1 400 euros, et en l’ouvrant j’ai découvert qu’il contenait une Nvidia V100S 32GB. Je l’ai revendue 1 600 euros, puis j’ai acheté deux CPU Xeon 6254 pour les remplacer. Ensuite, j’ai pris deux Blackwell RTX 4000 Pro, ce qui permet maintenant de jouer avec mon fils et de faire des expériences avec des LLM
Ce boîtier peut accueillir 4 GPU doubles, donc je pourrais peut-être un jour passer à quatre RTX 6000, soit 384GB de VRAM au total. Le matériel d’entreprise d’occasion est robuste, offre un excellent rapport qualité-prix, et c’est un hobby vraiment plaisant
C’est drôle de voir un serveur de 20 kg à 7,5k euros posé sur une table IKEA LACK à 5 euros. La LACK est donnée pour 25 kg max, donc ça paraît risqué
La phrase « j’ai conduit deux heures pour aller le chercher moi-même » est amusante. Littéralement, Your mileage may vary
Le fait qu’il ait laissé les commandes d’installation pour les explorateurs suivants, après avoir autant souffert à faire marcher les GPU, est appréciable
Il a fallu installer le pilote NVIDIA-Linux-aarch64, et chaque fois que je vois ce genre de commande ésotérique, je me dis « oui, moi aussi je suis passé par là »
Plus sérieusement, je me demande si ce type de machine offre aussi de bonnes performances en jeu. Comme c’est optimisé pour l’IA/ML, est-ce que ça ne finit pas par être mauvais pour les jeux classiques
Et aussi, quand il dit qu’il est « allé dans une ferme au fond des bois », je me suis demandé si ce n’était pas un peu dangereux
Ce genre de post est vraiment génial. Ces succès DIY sont une des saveurs uniques de Hacker News
Ça reste évidemment une bonne affaire, mais comparer ça au prix neuf d’un H100 est un peu exagéré. Aujourd’hui, on peut acheter une RTX 6000 Pro pour 7 à 8 000 dollars avec des performances similaires, et elle peut en plus s’installer dans une station de travail classique. La décote du matériel d’entreprise d’occasion est énorme
Blackwell est deux fois plus rapide qu’un H100 en FP8, mais ici la comparaison se fait en FP4, donc la réalité est différente. La bande passante VRAM en HBM3 atteint aussi 4,9TB/s, soit 2,5 fois les 1,8TB/s d’une RTX 6000 Pro
Le NVLink-C2C monte à 900GB/s entre cartes, soit environ 5 fois le PCIe5, ce qui réduit ce goulet d’étranglement sur les gros LLM
Par exemple, dans ce benchmark GPT-OSS-120B, la RTX 6000 Pro génère 145 tokens par seconde, contre 195 pour le GH200
On a vraiment l’impression de voir un rêve cyberpunk prendre vie dans le monde réel. Il faut un sacré courage pour tenter ce genre de chose
Je veux bien des recommandations de boutiques où acheter du matériel d’entreprise d’occasion. La plupart semblent être en Californie, mais je me demande s’il y en a aussi dans la région de New York / New Jersey