12 points par GN⁺ 2024-03-14 | 1 commentaires | Partager sur WhatsApp
  • NVTop = "Neat Videocard TOP"
  • Moniteur de tâches pour les GPU et accélérateurs
  • Gère les informations de plusieurs GPU et les affiche d'une manière similaire à htop
  • Fournisseurs actuellement pris en charge : AMD (pilote Linux amdgpu), Apple (prise en charge limitée de M1 et M2), Huawei (Ascend), Intel (pilote Linux i915), NVIDIA (pilote propriétaire Linux), Qualcomm Adreno (pilote Linux MSM)

Options de NVTOP et commandes interactives

  • Fenêtre de configuration interactive : appuyez sur F2 pour ouvrir un utilitaire de configuration permettant de personnaliser l'interface selon vos besoins.
  • Enregistrement de la configuration : en appuyant sur F12 dans la fenêtre de configuration, les paramètres sont enregistrés et rechargés lors du prochain lancement de nvtop.
  • Manuel NVTOP et options en ligne de commande : une page de manuel est disponible (man nvtop) et l'aide de la commande peut être affichée avec nvtop -h ou nvtop --help.

Prise en charge des GPU

  • AMD : prise en charge des GPU AMD via le pilote amdgpu. Les processus utilisant le GPU peuvent être consultés à partir du noyau 5.14.
  • Intel : prise en charge des GPU Intel via le pilote Linux i915. Les processus utilisant le GPU peuvent être consultés à partir du noyau 5.19.
  • NVIDIA : prise en charge via la bibliothèque NVML. Les GPU antérieurs à la microarchitecture Kepler ne prennent pas en charge certaines requêtes.
  • Adreno : prise en charge des GPU Adreno via le pilote Linux msm. Les processus utilisant le GPU peuvent être consultés à partir du noyau 6.0.
  • Apple : inclut un support initial pour Apple via Metal. Pris en charge uniquement lors d'un build Apple.
  • Ascend : prise en charge d'Ascend via l'API DCMI (version 6.0.0). Actuellement, DCMI ne prend en charge qu'un ensemble limité d'API.

Build

  • Bibliothèques requises : ncurses (interface utilisateur), NVIDIA (NVML), AMD (libdrm), Intel (i915), etc.
  • Processus de build : clonez le code source avec git clone, compilez avec cmake, puis installez sur le système avec make install.

Installation selon la distribution

  • Ubuntu / Debian : installation prise en charge via snap ou apt. Il est possible d'installer la dernière version de nvtop via un PPA.
  • Fedora / Red Hat / CentOS : installation prise en charge via AppImage ou dnf.
  • OpenSUSE : installation prise en charge via zypper.
  • Arch Linux : installation de nvtop via pacman.
  • Gentoo : installation de nvtop via layman et emerge.
  • AppImage : fourni comme application autonome. Donnez les droits d'exécution puis lancez-le.
  • Snap : après installation avec snap install, des autorisations doivent être accordées pour le contrôle des processus et l'inspection des informations GPU.
  • Docker : nécessite le pilote NVIDIA et nvidia-docker. Exécution avec docker build et docker run.

Avis de GN⁺

  • NVTOP prend en charge de nombreux fournisseurs de GPU et constitue un outil puissant pour la surveillance GPU sur les systèmes Linux.
  • Cet outil offre aux administrateurs système et aux développeurs un moyen efficace de suivre en temps réel l'utilisation des GPU.
  • La surveillance GPU est particulièrement importante lors de travaux dépendants du GPU, notamment en machine learning, en analyse de données et en développement de jeux.
  • Parmi les autres projets open source offrant des fonctionnalités similaires à NVTOP, on trouve gpustat, et les utilisateurs peuvent choisir l'outil le mieux adapté à leurs besoins.
  • S'agissant d'un projet open source, il peut être continuellement amélioré et enrichi de nouvelles fonctionnalités grâce aux contributions de la communauté.

1 commentaires

 
GN⁺ 2024-03-14
Avis Hacker News
  • nvtop ou nvidia-smi offrent une bonne vue d’ensemble de l’utilisation du GPU, mais ne reflètent pas vraiment la vitesse réelle des tâches. Si vous vous intéressez aux performances en IA, je recommande Nsight Compute CLI pour profiler les kernels individuels, et Nsight Systems pour une vue macro. Si vous utilisez PyTorch, je conseille d’utiliser le profiler PyTorch.
  • Exprime sa frustration face au fait que apt install ne fonctionne pas. Souligne que les problèmes d’installation liés à NVIDIA sont fréquents et qu’ils font perdre énormément de temps lors des réinstallations de Linux. Critique la confusion provoquée par les multiples couches et conflits de versions entre les drivers, CUDA, le toolkit CUDA, cuDNN, etc.
  • Présente Nvitop, un autre utilitaire qu’il préfère.
  • Cite nvtop et bottom comme ses moniteurs de ressources préférés sous Linux, et partage qu’il a appris que nvtop fonctionne aussi sur des périphériques non NVIDIA, pas seulement sur les appareils NVIDIA.
  • Dit préférer btop, qui, dans ses versions récentes, assure non seulement la surveillance générale des processus mais aussi celle du GPU.
  • Se réjouit de voir les utilitaires Linux pour cartes graphiques devenir multiplateformes, et évalue positivement l’abandon de l’ancienne approche centrée sur chaque driver.
  • Présente gpustat comme son utilitaire favori, expliquant qu’il fournit juste le minimum d’informations nécessaire pour savoir si l’entraînement se déroule bien ou s’il y a un problème.
  • Présente son propre projet, Zenith, qui combine non seulement la surveillance des GPU NVIDIA, mais aussi des fonctions comme le disque, le CPU et Top.
  • Explique qu’en commençant à utiliser Home Assistant, il a eu envie d’unifier toutes les sources de données. Il indique qu’il peut afficher les données comme il le souhaite, et mentionne avoir trouvé un projet appelé sensors2mqtt qu’il aimerait utiliser.
  • Exprime le souhait d’avoir une prise en charge du driver Nouveau.