- Offre une conversation fluide avec l’IA en s’appuyant sur les fonctionnalités de WhisperLive et WhisperSpeech, en liaison avec le LLM Mistral
- WhisperLive : implémentation de Whisper d’OpenAI pour fonctionner presque en temps réel afin de convertir la voix en texte
- WhisperSpeech : système TTS construit en inversant Whisper
- Le LLM et Whisper sont tous deux optimisés pour s’exécuter efficacement avec des moteurs TensorRT afin de maximiser les performances et les capacités de traitement en temps réel, et WhisperSpeech est optimisé avec
torch.compile
3 commentaires
Ce serait bien si la traduction en temps réel était rapide.
WhisperSpeech – un système open source de synthèse vocale conçu à rebours à partir de Whisper
Avis sur Hacker News
huggingface_cli, il note qu’il existe déjà des moyens de télécharger quelque chose à partir de son nom (index PyPI, etc.) et qu’il vaudrait peut-être mieux appliquer cela aux modèles.