1 points par GN⁺ 2024-09-14 | 1 commentaires | Partager sur WhatsApp

71 TiB de NAS ZFS sans panne de disque en 10 ans

  • Matériel

    • NAS ZFS de 71 TiB composé de 24 disques de 4 To
    • Aucune panne de disque en 10 ans
    • Utilise actuellement une deuxième carte mère et une deuxième alimentation
  • Gestion des disques

    • Les disques HGST de 4 To ont été utilisés environ 6000 heures sur 10 ans
    • Éteindre le serveur lorsqu’il n’est pas utilisé aide à prolonger la durée de vie des disques
    • Utilisation de scripts pour allumer et éteindre le serveur à distance
    • Le serveur reste éteint par défaut pour économiser de l’énergie et prolonger la durée de vie des disques
  • Remplacement de la carte mère

    • Carte mère remplacée il y a quelques années à cause d’une panne
    • Problèmes rencontrés : impossible d’entrer dans le BIOS et échec du démarrage
    • Problème résolu en achetant la même carte mère sur Ebay
  • ZFS

    • ZFS fonctionne sans problème sur plusieurs systèmes d’exploitation
    • zpool scrub a été exécuté plusieurs fois sans aucune erreur de checksum
    • ZFS est très efficace pour prévenir la perte de données
  • Gestion du bruit

    • La vitesse par défaut des ventilateurs est très élevée, ce qui rend le système bruyant
    • Écriture d’un script pour ajuster la vitesse des ventilateurs selon la température
    • Utilisation d’un contrôleur PID pour régler la vitesse des ventilateurs et le bruit
  • Réseau

    • Au départ, utilisation d’un contrôleur réseau Gigabit
    • Après passage à une carte Infiniband, vitesse de transfert de 700 MB/s atteinte
    • Utilise actuellement une carte Ethernet 10 Gbit
  • Alimentation

    • Au démarrage, tous les disques montent en rotation en même temps, avec une consommation de 600 W
    • L’alimentation coupe parfois le courant au démarrage
  • Abandon de l’UPS

    • L’UPS consommait de l’énergie supplémentaire, son usage a donc été arrêté
    • Acceptation du risque de perte du système en cas de problème électrique
  • Sauvegarde

    • Les données importantes sont sauvegardées trois fois
    • Les données non importantes ne sont pas sauvegardées
    • Prévention de la perte de données grâce au remplacement du matériel et à ZFS
  • Plans futurs

    • Aucun projet d’extension de stockage pour le moment
    • Possède une carte mère de rechange, un CPU, de la mémoire et une carte HBA
    • L’augmentation de la capacité des disques pourrait permettre un passage à un format plus compact
    • Si le système tombe en panne, il est possible qu’il abandonne ce hobby du stockage

Résumé de GN⁺

  • Cet article partage l’expérience d’un NAS ZFS de 71 TiB exploité pendant 10 ans sans aucune panne de disque
  • Éteindre le serveur lorsqu’il n’est pas utilisé aide grandement à prolonger la durée de vie des disques
  • ZFS est très efficace pour prévenir la perte de données, et le réglage de la vitesse des ventilateurs permet de réduire le bruit
  • Différentes cartes réseau ont été utilisées pour augmenter les vitesses de transfert
  • L’article partage aussi des retours d’expérience sur la stratégie de sauvegarde et la gestion de l’alimentation

1 commentaires

 
GN⁺ 2024-09-14
Avis Hacker News
  • La discussion porte surtout sur ZFS et BTRFS, mais on se demande si quelqu’un a déjà essayé bcachefs

    • bcachefs est intégré au noyau Linux et dispose d’une fonction de checksum de bout en bout
    • son auteur prend très au sérieux les responsabilités d’un système de fichiers
  • Question sur l’existence d’un calendrier de rotation des disques

    • 24 disques du même modèle sont utilisés, et ils semblent provenir du même lot
    • ils ont donc davantage de chances de tomber en panne en même temps à cause d’un niveau d’usure similaire
    • un stockage fiable est compliqué à mettre en place
  • Certains avancent à l’inverse que laisser les disques allumés en permanence peut réduire l’usure par rapport à des extinctions régulières

    • préférence pour laisser un NAS ZFS allumé en continu afin d’inspecter régulièrement les données
    • en 10 ans d’exploitation d’un système à 4 disques, 2 disques sont tombés en panne, mais ce n’étaient pas des disques de niveau entreprise (WD Green)
  • Les grands ventilateurs peuvent déplacer beaucoup d’air même à faible RPM, avec une bonne efficacité énergétique

    • Oxide Computer met en avant l’usage de ventilateurs de 80 mm, silencieux et peu gourmands en énergie
    • sur d’autres serveurs, la consommation des ventilateurs peut représenter 25 % de la consommation totale, contre environ 1 % ici
  • Souhait d’en savoir plus sur la collection de films

    • intérêt pour la manière dont les premiers éléments ont été choisis et pour ceux qui sont restés dans la collection plus de 10 ans
  • Prend le risque de perdre le système à cause de problèmes d’alimentation électrique

    • un UPS aide à éviter les pannes rares dues à des déséquilibres électriques
    • des travaux ou la foudre peuvent provoquer des surtensions
    • l’UPS se sacrifie lui-même avant que le serveur ne soit endommagé, ce qui le protège
  • 24 disques peuvent offrir des avantages en performances, mais un NAS 6 baies avec des disques de 18 To apporte de nombreux avantages en matière de consommation électrique, de bruit, d’encombrement, de coût et de fiabilité

  • L’environnement dans lequel fonctionnent les disques a une grande influence sur leur durée de vie

    • un environnement résidentiel est plus variable qu’un data center ou un espace de bureau
    • les variations de température et d’humidité, ainsi que la poussière, ont un impact important
    • dans un environnement propre et stable, les pannes de disques diminuent nettement
  • Le secret n’était pas d’éteindre les disques, mais simplement d’avoir eu de la chance

    • des disques HGST de 4 To tournent 24/7 depuis plus de 10 ans sans panne
    • d’autres ont connu plusieurs RMA avec les mêmes disques
  • Certains disques étaient vulnérables aux changements de cycle d’alimentation

    • ce n’est pas toujours bénéfique pour tout le monde
    • certains SSD ont besoin d’être alimentés périodiquement
    • le cycle d’utilisation d’un NAS est susceptible de répondre à cette exigence
    • le coût de l’électricité a baissé
    • on se demande si Backblaze modélise les statistiques de durée de vie des disques en fonction du nombre d’allumages/extinctions