1 points par GN⁺ 2025-12-12 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Expérimentation consistant à transformer un Nvidia Grace-Hopper GH200 en AI desktop personnel, avec des performances suffisantes pour exécuter localement un modèle de 235B paramètres
  • Sur Reddit, achat d’un système GH200 d’occasion pour 7 500 €, puis remontage d’un serveur de centre de données à refroidissement liquide en desktop à air
  • Gestion de nombreux dépannages matériels : défaut d’affichage de la température GPU à 16 777 214 °C à cause du refroidissement, de l’alimentation et d’erreurs de capteurs, panne de circuit de ventilateurs, réparations par brasage manuel
  • Réalisation finale avec 4 radiateurs AIO, adaptateurs usinés CNC et composants en impression 3D pour obtenir un système stable
  • Coût total d’environ 9 000 €, ce qui permet de construire une station de travail IA hautes performances à moindre coût qu’un GPU H100 seul

Achat et spécifications du serveur Grace-Hopper

  • Sur le forum r/LocalLLaMA de Reddit, repérage d’une annonce de serveur GH200 à 10 000 € puis achat après négociation à 7 500 €
    • Configuration : 2× Grace-Hopper Superchip, 2× Grace CPU 72 cœurs, 2× H100 GPU, 480 Go de LPDDR5X, 96 Go de HBM3, au total 1 152 Go de mémoire haute performance
    • Bande passante NVLink-C2C de 900 Go/s, puissance comprise entre 1 000 et 2 000 W, alimentation 3 000 W incluse
  • Le vendeur est GPTshop.ai, une société qui convertit des serveurs Nvidia pour les vendre en desktop
    • Le système était déjà une forme de « système Frankenstein » convertissant un serveur en eau en air cooling
    • Boîtier rustique, impossible à monter en rack, alimentation 48 V ajoutée

Démontage et nettoyage du serveur

  • Le serveur était très encrassé par la poussière, et les 8 ventilateurs haute puissance produisaient un niveau sonore comparable à celui d’un aspirateur
    • Trop bruyant pour une utilisation à la maison, le démontage puis le nettoyage et le remontage ont donc été effectués
  • Nettoyage complet de la carte mère avec plusieurs litres d’isopropanol, puis séchage pendant une semaine sur plaque chauffante
  • Démontage des modules Grace-Hopper pour inspecter leur état interne et explorer la structure à l’intérieur

Reconfiguration du refroidissement liquide

  • Pour réduire les risques de fuite, remplacement des blocs sur mesure par 4 AIO Arctic Liquid Freezer III 420
    • Mesure des dimensions des dies GPU et CPU, puis conception du bloc adaptateur dans Fusion 360
    • Réalisation d’un prototype avec une imprimante Bambu X1, puis passage en usinage CNC pour la pièce finale
  • Retrait de l’huile résiduelle après usinage et assemblage, avec validation des performances de refroidissement

Assemblage du desktop

  • Fabrication d’un châssis en ProfilAlu en aluminium, conçu via Fusion 360
    • Conception et impression 3D de dizaines de pièces de montage pour PCB et filtres
    • Utilisation de plusieurs kilos de filament pour rigidifier la structure

Principaux problèmes rencontrés

  • Lors du branchement de l’alimentation des ventilateurs, apparition d’un bruit de « pop » et de fumée, avec dommage de certains circuits de connecteur de ventilateur
    • Panne probable d’un MOSFET due à un calcul de courant incorrect
    • L’alimentation des ventilateurs a été remplacée par un adaptateur 12V-5A dédié
  • Les erreurs de ventilateur ont empêché le démarrage via le BMC (Baseboard Management Controller)
    • Contournement du contrôle des ventilateurs en désactivant phosphor-sensor-monitor.service

Erreur de température GPU et réparation des circuits

  • Au démarrage, la température GPU affichait 16 777 214 °C, provoquant l’arrêt automatique du système
    • Il s’agissait de la valeur maximale d’un entier 24 bits (2²⁴-2), indiquant une erreur de signal de capteur
  • Inspection au microscope : identification d’un condensateur de 100 nF et d’une résistance de 4,7 kΩ endommagés
    • Réparation au soudage fin puis fixation au masque UV
    • Redémarrage réussi après remontage

Configuration finale et performances

  • Pièces ajoutées :
    • Fixation d’un SSD E1.S 8 To, panneau arrière pour alimentation 3 kW, grille de protection pour radiateurs
  • Le problème d’initialisation du GPU a été résolu par désactivation de NVLink
    • Ajout de NVreg_NvLinkDisable=1 dans /etc/modprobe.d/nvidia-disable-nvlink.conf

Résultats de benchmark

  • Compilation de Llama.cpp en 90 s avec 144 cœurs, avec les résultats de tests de grands modèles :
    • gpt-oss-120b-Q4_K_M : prompt 2974.79, tokens 195.84
    • GLM-4.5-Air-Q4_K_M : prompt 1936.65, tokens 100.71
    • Qwen3-235B-A22B-Instruct : prompt 1022.79, tokens 65.90
  • Consommation d’environ 300 W par GPU, avec de la marge par rapport au maximum de 900 W

Détails des coûts

  • Serveur Grace-Hopper : 7 500 €, SSD : 250 €, adaptateur CNC : 700 €, refroidisseurs à liquide : 180 €
  • Châssis : 200 €, panneau en verre : 40 €, matériau d’impression 3D : 40 €, autres composants : 50 €
  • Isopropanol pour nettoyage : 20 €, alimentation 12V : 10 €, éclairage LED : 10 €
  • Total d’environ 9 000 €, inférieur au prix d’un GPU H100 seul

Conclusion

  • Réalisation d’un desktop capable d’exécuter localement des modèles de 235B paramètres
  • Conversion d’un matériel de centre de données pour usage personnel avec contournement de nombreux obstacles tels que erreurs de capteurs, dégâts de circuits et problèmes de refroidissement
  • Résultat final : une workstation de recherche IA hautes performances bâtie à faible coût

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.