WaaS - Whisper as a Service
(github.com/schibsted)- GUI et API open source pour utiliser facilement en local OpenAI Whisper (modèle de reconnaissance vocale)
- Fournit des fonctionnalités telles que
transcribe/detect/downloadvia une API REST - Permet de démarrer une tâche en téléversant des fichiers audio/vidéo depuis une page web
- S’exécute avec
docker-compose(lance 3 conteneurs Docker commeredis/api/worker) - Le plus petit modèle,
tiny, nécessite environ 1 Go de VRAM (large, le plus grand, en demande 10 Go)
1 commentaires
Whisper - système de reconnaissance vocale multilingue (ASR) publié en open source par OpenAI
OpenAI publie le modèle Whisper v2