1 points par GN⁺ 2025-12-12 | 1 commentaires | Partager sur WhatsApp
  • Expérimentation consistant à transformer un Nvidia Grace-Hopper GH200 en AI desktop personnel, avec des performances suffisantes pour exécuter localement un modèle de 235B paramètres
  • Sur Reddit, achat d’un système GH200 d’occasion pour 7 500 €, puis remontage d’un serveur de centre de données à refroidissement liquide en desktop à air
  • Gestion de nombreux dépannages matériels : défaut d’affichage de la température GPU à 16 777 214 °C à cause du refroidissement, de l’alimentation et d’erreurs de capteurs, panne de circuit de ventilateurs, réparations par brasage manuel
  • Réalisation finale avec 4 radiateurs AIO, adaptateurs usinés CNC et composants en impression 3D pour obtenir un système stable
  • Coût total d’environ 9 000 €, ce qui permet de construire une station de travail IA hautes performances à moindre coût qu’un GPU H100 seul

Achat et spécifications du serveur Grace-Hopper

  • Sur le forum r/LocalLLaMA de Reddit, repérage d’une annonce de serveur GH200 à 10 000 € puis achat après négociation à 7 500 €
    • Configuration : 2× Grace-Hopper Superchip, 2× Grace CPU 72 cœurs, 2× H100 GPU, 480 Go de LPDDR5X, 96 Go de HBM3, au total 1 152 Go de mémoire haute performance
    • Bande passante NVLink-C2C de 900 Go/s, puissance comprise entre 1 000 et 2 000 W, alimentation 3 000 W incluse
  • Le vendeur est GPTshop.ai, une société qui convertit des serveurs Nvidia pour les vendre en desktop
    • Le système était déjà une forme de « système Frankenstein » convertissant un serveur en eau en air cooling
    • Boîtier rustique, impossible à monter en rack, alimentation 48 V ajoutée

Démontage et nettoyage du serveur

  • Le serveur était très encrassé par la poussière, et les 8 ventilateurs haute puissance produisaient un niveau sonore comparable à celui d’un aspirateur
    • Trop bruyant pour une utilisation à la maison, le démontage puis le nettoyage et le remontage ont donc été effectués
  • Nettoyage complet de la carte mère avec plusieurs litres d’isopropanol, puis séchage pendant une semaine sur plaque chauffante
  • Démontage des modules Grace-Hopper pour inspecter leur état interne et explorer la structure à l’intérieur

Reconfiguration du refroidissement liquide

  • Pour réduire les risques de fuite, remplacement des blocs sur mesure par 4 AIO Arctic Liquid Freezer III 420
    • Mesure des dimensions des dies GPU et CPU, puis conception du bloc adaptateur dans Fusion 360
    • Réalisation d’un prototype avec une imprimante Bambu X1, puis passage en usinage CNC pour la pièce finale
  • Retrait de l’huile résiduelle après usinage et assemblage, avec validation des performances de refroidissement

Assemblage du desktop

  • Fabrication d’un châssis en ProfilAlu en aluminium, conçu via Fusion 360
    • Conception et impression 3D de dizaines de pièces de montage pour PCB et filtres
    • Utilisation de plusieurs kilos de filament pour rigidifier la structure

Principaux problèmes rencontrés

  • Lors du branchement de l’alimentation des ventilateurs, apparition d’un bruit de « pop » et de fumée, avec dommage de certains circuits de connecteur de ventilateur
    • Panne probable d’un MOSFET due à un calcul de courant incorrect
    • L’alimentation des ventilateurs a été remplacée par un adaptateur 12V-5A dédié
  • Les erreurs de ventilateur ont empêché le démarrage via le BMC (Baseboard Management Controller)
    • Contournement du contrôle des ventilateurs en désactivant phosphor-sensor-monitor.service

Erreur de température GPU et réparation des circuits

  • Au démarrage, la température GPU affichait 16 777 214 °C, provoquant l’arrêt automatique du système
    • Il s’agissait de la valeur maximale d’un entier 24 bits (2²⁴-2), indiquant une erreur de signal de capteur
  • Inspection au microscope : identification d’un condensateur de 100 nF et d’une résistance de 4,7 kΩ endommagés
    • Réparation au soudage fin puis fixation au masque UV
    • Redémarrage réussi après remontage

Configuration finale et performances

  • Pièces ajoutées :
    • Fixation d’un SSD E1.S 8 To, panneau arrière pour alimentation 3 kW, grille de protection pour radiateurs
  • Le problème d’initialisation du GPU a été résolu par désactivation de NVLink
    • Ajout de NVreg_NvLinkDisable=1 dans /etc/modprobe.d/nvidia-disable-nvlink.conf

Résultats de benchmark

  • Compilation de Llama.cpp en 90 s avec 144 cœurs, avec les résultats de tests de grands modèles :
    • gpt-oss-120b-Q4_K_M : prompt 2974.79, tokens 195.84
    • GLM-4.5-Air-Q4_K_M : prompt 1936.65, tokens 100.71
    • Qwen3-235B-A22B-Instruct : prompt 1022.79, tokens 65.90
  • Consommation d’environ 300 W par GPU, avec de la marge par rapport au maximum de 900 W

Détails des coûts

  • Serveur Grace-Hopper : 7 500 €, SSD : 250 €, adaptateur CNC : 700 €, refroidisseurs à liquide : 180 €
  • Châssis : 200 €, panneau en verre : 40 €, matériau d’impression 3D : 40 €, autres composants : 50 €
  • Isopropanol pour nettoyage : 20 €, alimentation 12V : 10 €, éclairage LED : 10 €
  • Total d’environ 9 000 €, inférieur au prix d’un GPU H100 seul

Conclusion

  • Réalisation d’un desktop capable d’exécuter localement des modèles de 235B paramètres
  • Conversion d’un matériel de centre de données pour usage personnel avec contournement de nombreux obstacles tels que erreurs de capteurs, dégâts de circuits et problèmes de refroidissement
  • Résultat final : une workstation de recherche IA hautes performances bâtie à faible coût

1 commentaires

 
GN⁺ 2025-12-12
Avis sur Hacker News
  • J’ai acheté du matériel IA de niveau datacenter et, après une suite de galères en le modifiant de refroidissement liquide → air → de nouveau liquide, avec entre autres une température GPU affichée à 16 millions de degrés, j’ai fini par assembler un desktop capable de faire tourner un modèle de 235B paramètres à la maison
    C’est l’histoire d’une décision insensée, de résolution créative de problèmes et d’une tentative de transformer du matériel de datacenter en machine du quotidien

    • J’ai découvert qu’en demandant au pilote d’ignorer complètement NVLINK, les GPU s’initialisaient indépendamment via PCIe
      Il m’a fallu une semaine pour trouver ça, et c’est Reddit qui m’a sauvé. Je me demande si ce genre de problème peut aussi arriver dans tous les datacenters
    • J’avais vu le même post sur Reddit et j’ai envisagé d’en acheter un aussi, mais j’ai laissé tomber parce que je vis aux États-Unis. Heureusement que ce n’était pas une arnaque
    • Il a dit avoir payé 7 500 euros en liquide, alors je me demande s’il a vraiment retiré toute la somme en billets. J’aimerais savoir comment sa banque a pu lui fournir un montant pareil
    • J’ai été impressionné qu’il ait fixé des pièces soudées à l’époxy. Il faut vraiment avoir confiance en ses compétences en soudure pour faire ça. Je me demande s’il n’avait pas de pistolet à colle
  • J’ai eu une expérience similaire. Depuis 3 ans, je voulais construire avec mon fils un serveur de jeu en rack, mais comme notre logement est petit et que ma femme n’était pas d’accord, j’ai utilisé l’installation photovoltaïque de mes parents (90 kWp) et leurs serveurs en rack
    Il y a deux mois, j’ai acheté sur eBay un Supermicro SYS-7049GP-TRT pour 1 400 euros, et en l’ouvrant j’ai découvert qu’il contenait une Nvidia V100S 32GB. Je l’ai revendue 1 600 euros, puis j’ai acheté deux CPU Xeon 6254 pour les remplacer. Ensuite, j’ai pris deux Blackwell RTX 4000 Pro, ce qui permet maintenant de jouer avec mon fils et de faire des expériences avec des LLM
    Ce boîtier peut accueillir 4 GPU doubles, donc je pourrais peut-être un jour passer à quatre RTX 6000, soit 384GB de VRAM au total. Le matériel d’entreprise d’occasion est robuste, offre un excellent rapport qualité-prix, et c’est un hobby vraiment plaisant

  • C’est drôle de voir un serveur de 20 kg à 7,5k euros posé sur une table IKEA LACK à 5 euros. La LACK est donnée pour 25 kg max, donc ça paraît risqué

    • En réalité, le boîtier d’origine faisait 20 kg, mais maintenant avec le cadre en aluminium et les panneaux en verre on est plutôt autour de 40 kg. En y repensant, je ne devrais sans doute pas le poser sur une LACK
    • Cela dit, les tables LACK sont étonnamment solides. Beaucoup de gens les utilisent pour des serveurs ou du matériel réseau, et le wiki LackRack regorge d’exemples. Moi-même, j’y ai déjà posé plus de 100 kg
    • Bon, on peut toujours plaisanter en disant qu’il y a bien une marge de sécurité de 25 %
  • La phrase « j’ai conduit deux heures pour aller le chercher moi-même » est amusante. Littéralement, Your mileage may vary

  • Le fait qu’il ait laissé les commandes d’installation pour les explorateurs suivants, après avoir autant souffert à faire marcher les GPU, est appréciable
    Il a fallu installer le pilote NVIDIA-Linux-aarch64, et chaque fois que je vois ce genre de commande ésotérique, je me dis « oui, moi aussi je suis passé par là »

  • Plus sérieusement, je me demande si ce type de machine offre aussi de bonnes performances en jeu. Comme c’est optimisé pour l’IA/ML, est-ce que ça ne finit pas par être mauvais pour les jeux classiques
    Et aussi, quand il dit qu’il est « allé dans une ferme au fond des bois », je me suis demandé si ce n’était pas un peu dangereux

    • Quand le vendeur a dit « le serveur est à l’arrière du van blanc » en montrant le coffre, j’ai eu un peu peur. Heureusement, j’ai ensuite vu l’atelier derrière, ce qui m’a rassuré
    • Ces GPU n’ont pas de sortie HDMI ni DisplayPort, donc pour jouer il faut passer via une VM
    • Pour le jeu, la combinaison idéale, c’est RTX PRO 6000 Blackwell + AMD 9800X3D + RAM à faible latence + NVMe. Au-delà, le rendement marginal chute fortement. Les CPU serveur ARM posent aussi des problèmes de DRM
    • Une vidéo de LTT a aussi testé un GPU IA similaire, et les performances en jeu étaient catastrophiques. Une carte grand public de milieu de gamme faisait mieux pour un dixième du prix
  • Ce genre de post est vraiment génial. Ces succès DIY sont une des saveurs uniques de Hacker News

    • Oui. Ça suscite la jalousie tout en donnant l’inspiration de se dire « moi aussi, je pourrais peut-être le faire »
  • Ça reste évidemment une bonne affaire, mais comparer ça au prix neuf d’un H100 est un peu exagéré. Aujourd’hui, on peut acheter une RTX 6000 Pro pour 7 à 8 000 dollars avec des performances similaires, et elle peut en plus s’installer dans une station de travail classique. La décote du matériel d’entreprise d’occasion est énorme

    • Cela dit, ça reste une excellente affaire. La raison tient aux subtilités entre RAM et VRAM
      Blackwell est deux fois plus rapide qu’un H100 en FP8, mais ici la comparaison se fait en FP4, donc la réalité est différente. La bande passante VRAM en HBM3 atteint aussi 4,9TB/s, soit 2,5 fois les 1,8TB/s d’une RTX 6000 Pro
      Le NVLink-C2C monte à 900GB/s entre cartes, soit environ 5 fois le PCIe5, ce qui réduit ce goulet d’étranglement sur les gros LLM
      Par exemple, dans ce benchmark GPT-OSS-120B, la RTX 6000 Pro génère 145 tokens par seconde, contre 195 pour le GH200
    • Et en plus, il a deux H100. Acheter deux RTX 6000 Pro coûterait 15 à 16 000 dollars, et la RAM incluse vaut à elle seule plus de 7 000 dollars
  • On a vraiment l’impression de voir un rêve cyberpunk prendre vie dans le monde réel. Il faut un sacré courage pour tenter ce genre de chose

  • Je veux bien des recommandations de boutiques où acheter du matériel d’entreprise d’occasion. La plupart semblent être en Californie, mais je me demande s’il y en a aussi dans la région de New York / New Jersey

    • Il suffit de repérer sur eBay des vendeurs qui listent plusieurs produits et de les suivre à la trace. Il y a pas mal de vendeurs de ce type dans tout le pays