9 points par GN⁺ 2025-12-21 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Des tests comparant l’exécution de GPU AMD, Intel et Nvidia sur un Raspberry Pi 5 à celle sur un PC de bureau montrent dans de nombreux cas une perte de performances limitée à 2 à 5 %
  • Quatre catégories ont été testées — transcodage Jellyfin, rendu GravityMark, inférence LLM/IA et configuration multi-GPU — afin de mesurer l’efficacité et les performances par rapport au coût
  • Dans un cas avec 4 Nvidia RTX A5000 connectés, l’écart de performances reste inférieur à 2 % par rapport à un serveur Intel, le partage de mémoire entre GPU via un switch PCIe jouant un rôle clé
  • Le coût total d’un système eGPU Raspberry Pi est d’environ 350 à 400 $, contre 1 500 à 2 000 $ pour un PC, avec en plus une consommation bien plus faible côté Pi (4 à 5 W au repos contre 30 W)
  • Un exemple qui démontre le potentiel du Raspberry Pi comme plateforme alternative basse consommation et à faible coût pour exploiter efficacement de gros GPU

Aperçu de l’expérience

  • Vérification de la possibilité d’exploiter des GPU malgré la limite de bande passante PCIe Gen 3 x1 (8 GT/s) du Raspberry Pi 5
    • La comparaison a été faite avec un PC de bureau récent (PCIe Gen 5 x16, 512 GT/s)
  • Les tests portaient sur le transcodage multimédia (Jellyfin), le rendu GPU (GravityMark), les performances LLM/IA et les configurations multi-GPU
  • Un essai de fonctionnement simultané de 2 GPU a été réalisé à l’aide d’un switch externe PCIe Gen 4 et d’un backplane 3 slots de Dolphin ICS

Cas d’un Raspberry Pi relié à 4 GPU

  • L’utilisateur GitHub mpsparrow a connecté 4 GPU Nvidia RTX A5000 à un seul Pi
    • Lors de l’exécution du modèle Llama 3 70B, l’écart de performances est resté dans les 2 % par rapport à un serveur Intel (11.83 vs 12 tokens/sec)
  • Le switch PCIe permet le partage de mémoire entre GPU, ce qui contourne la contrainte de bande passante du Pi
  • Même avec un seul GPU, certaines charges montrent des performances équivalentes ou supérieures à celles d’un desktop

Comparaison des coûts et de l’efficacité

  • Configuration Raspberry Pi eGPU : environ 350 à 400 $ ; configuration PC Intel : environ 1 500 à 2 000 $
  • Consommation au repos : Pi 4 à 5 W, PC 30 W
  • À GPU identique mais hors coût du GPU, le Pi est devant à la fois en coût et en efficacité énergétique

Benchmark de transcodage Jellyfin

  • Avec une Nvidia 4070 Ti, le PC garde l’avantage en débit brut (2GB/s)
    • Le Pi atteint environ 850MB/s en PCIe et 300MB/s sur SSD USB
  • Mais pour le streaming multimédia H.264/H.265, le Pi gère aussi sans difficulté le transcodage 1080p et 4K
    • Prise en charge de l’encodage matériel NVENC, avec 2 transcodages simultanés stables
  • Les GPU AMD ont montré quelques problèmes de stabilité en transcodage

Test de rendu GravityMark

  • Tests menés principalement avec des GPU AMD ; le PC est légèrement plus rapide, mais l’écart reste minime
  • Avec une RX 460, le Pi affiche une meilleure efficacité (performances/W) que le PC
  • Sur d’anciens GPU limités au PCIe Gen 3, le Pi conserve un avantage relatif

Comparaison des performances IA et LLM

  • Lors du test de l’AMD Radeon AI Pro R9700 (32GB VRAM), les performances ont été inférieures aux attentes, possiblement à cause d’un problème de pilote ou de réglage BAR
  • Avec une Nvidia RTX 3060 (12GB), le Pi est plus rapide que le PC sur le modèle Llama 2 13B
  • Les mesures d’efficacité montrent que le Pi est meilleur en débit par watt que le PC
  • Même avec une RTX 4090, l’écart reste dans les 5 % sur un grand modèle (Qwen3 30B), avec dans de nombreux cas un avantage au Pi en efficacité
  • Les backends CUDA et Vulkan fonctionnent tous deux correctement sur le Pi

Expérience en configuration double GPU

  • Utilisation d’une carte d’interconnexion PCIe Dolphin et d’un MXH932 HBA
  • La désactivation de l’ACS a permis l’accès direct à la mémoire entre GPU
  • Avec une combinaison de modèles de GPU différents (4070, A4000), le pooling de VRAM n’est pas pris en charge, ce qui limite le gain de performances
  • Avec des GPU identiques, il devient possible d’exécuter des modèles plus grands comme Qwen3 30B
  • La combinaison AMD RX 7900 XT + R9700 a échoué à exécuter certains modèles à cause de problèmes de pilote
  • Le PC Intel reste globalement plus rapide, mais le Pi conserve des performances proches sur les grands modèles

Conclusion

  • En performances absolues et en confort d’utilisation, le PC garde l’avantage
  • Mais pour les charges centrées sur le GPU dans un environnement basse consommation et à faible coût, le Raspberry Pi constitue une alternative pratique
  • Une réduction de 20 à 30 W au repos est possible, et les SBC basés sur Rockchip ou Qualcomm offrent encore une meilleure efficacité et davantage de bande passante I/O
  • L’objectif de l’expérience était de comprendre les limites du Pi et l’architecture du GPU computing, tout en confirmant le potentiel des systèmes compacts

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.