8 points par xguru 2025-02-19 | 2 commentaires | Partager sur WhatsApp

Qu'est-ce qu'Audiblez ?

  • Un outil qui convertit les ebooks .epub en livres audio .m4b
  • Utilise une synthèse vocale haute qualité basée sur Kokoro-82M
  • Proposé sous licence Apache et entraîné avec moins de 100 heures de données audio
  • Sur le GPU T4 de Google Colab, peut convertir "Animal Farm" en environ 5 minutes avec une « vitesse de conversion de 600 caractères par seconde »
  • Sur un MacBook Pro M2 (mode CPU), il faut « environ 1 heure à une vitesse de 60 caractères par seconde »
    • Pas de prise en charge CUDA actuellement sur Apple Silicon (M1, M2) ; prise en charge MLX en attente

Principales mises à jour d'Audiblez 4.2

  • Prise en charge d'une interface graphique multiplateforme basée sur wxWidgets (Mac, Windows, Linux)
  • Prise en charge de nombreuses langues (anglais, espagnol, français, hindi, italien, japonais, portugais, chinois)
  • Passage d'ONNX à une base Torch utilisant le package kokoro
  • Prise en charge de l'accélération CUDA (mais exécution en mode CPU sur Apple Silicon)
  • Ajout d'une image de couverture et d'horodatages de chapitres dans le livre audio
  • Amélioration de la prise en charge de Windows

2 commentaires

 
xguru 2025-02-19

Convertir des livres électroniques en livres audio avec le modèle Kokoro-82M
C’est basé sur ça, mais le coréen inclus ici n’est pas présent dans Audiblez (même si, dans les commentaires, certains disent que la qualité du coréen de Kokoro n’est pas très bonne)

 
inosphe 2025-02-19

En regardant les anciens historiques du projet kokoro, il y avait clairement une voix coréenne, mais d’après les discussions côté Discord, il semble qu’ils aient du mal à la distribuer à cause de la clause d’interdiction d’exportation à l’étranger des données de l’AI Hub coréen…