7 points par leelou2 2025-11-17 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Comment utiliser rapidement le nouveau ElevenLabs Realtime Speech to Text

J’ai implémenté uniquement la fonction de transcription vocale de la manière la plus simple possible 🙏

  1. git clone https://github.com/lee-lou2/ai-note.git
  2. Accéder à Speech to Text sur https://elevenlabs.io/app/developers/api-keys pour générer une clé API
  3. Dans la page du projet cloné, dupliquer .env.sample pour créer un fichier .env
  4. Enregistrer la clé API ElevenLabs générée dans ELEVENLABS_API_KEY, et renseigner dans BASIC_AUTH_USERNAME et BASIC_AUTH_PASSWORD les identifiants à utiliser pour accéder à la page
  5. Installer les paquets : pip install -r requirements.txt
  6. Lancer : uvicorn main:app --reload --port 8000

Ensuite, il suffit d’accéder à http://localhost:8000 pour l’utiliser immédiatement

Il est clair que ElevenLabs Realtime Speech to Text v2 est rapide et précis.
Les utilisateurs gratuits peuvent aussi l’utiliser actuellement (la politique tarifaire d’ElevenLabs peut toutefois changer par la suite).

Ce dépôt GitHub continuera d’être mis à jour.

  • (Prévu) une fonctionnalité permettant à plusieurs utilisateurs de se connecter ensemble et de mettre à jour un même document
  • (Prévu) une fonctionnalité de résumé du contenu transcrit
  • (Prévu) une fonctionnalité de résumé avec le document saisi au clavier

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.