M3 comparés avec Whisper et MLX

xguru · 2023-12-14T10:56:01+09:00

Benchmark des performances de MLX, le framework de machine learning présenté par Apple Transcription d’un audio de 10 minutes avec Whisper M1 Pro (modèle 2021) + MLX + 32 Go de RAM : 216 secondes i7 + 4090 + 64 Go de RAM : 186 secondes Un GPU à 2 000 € est 30 secondes (16 %) plus rapide que le M1 M2 Ultra (76 GPU) : 95 secondes M3 Max (40 GPU) : 100 secondes En utilisant insanely-fast-whisper, optimisé pour Nvidia, l’opération se termine en seulement 8 secondes sur une 4090 En exécutant ce modèle sur un M1, cela prend plus de temps, soit 359 secondes

(owehrens.com)

14 points par xguru 2023-12-14 | 1 commentaires | Partager sur WhatsApp

Benchmark des performances de MLX, le framework de machine learning présenté par Apple
Transcription d’un audio de 10 minutes avec Whisper
- M1 Pro (modèle 2021) + MLX + 32 Go de RAM : 216 secondes
- i7 + 4090 + 64 Go de RAM : 186 secondes
  - Un GPU à 2 000 € est 30 secondes (16 %) plus rapide que le M1
- M2 Ultra (76 GPU) : 95 secondes
- M3 Max (40 GPU) : 100 secondes
En utilisant insanely-fast-whisper, optimisé pour Nvidia, l’opération se termine en seulement 8 secondes sur une 4090
- En exécutant ce modèle sur un M1, cela prend plus de temps, soit 359 secondes

1 commentaires

xguru 2023-12-14

MLX - un framework d’array similaire à Numpy pour Apple Silicon

Nvidia 4090 et M1/M2/M3 comparés avec Whisper et MLX

À lire aussi

1 commentaires