10 points par rbynddd 10 시간 전 | 3 commentaires | Partager sur WhatsApp
  • Prise en charge de 31 langues, dont le coréen
  • Nouvelle prise en charge des balises d’émotion : il est possible d’insérer dans le texte 10 types de balises, comme <laugh>, <breath>, <scream>, pour exprimer des émotions
  • Améliorations de la qualité : meilleure précision de prononciation, réduction des échecs de répétition/omission de mots, amélioration des performances de clonage vocal
  • Taille du modèle : 99M Parameters
  • TTS on-device : confidentialité totale garantie, aucune latence réseau
  • Facilité de déploiement : exécutable sur navigateur, PC, mobile, Raspberry Pi, etc.
  • 10 voix prédéfinies fournies
  • Modèle ouvert : usage commercial autorisé (OpenRAIL-M)

3 commentaires

 
hshim 7 시간 전

Il semble nettement plus stable que les autres modèles légers.

 
greekr4 9 시간 전

Oh, il va falloir que je teste ça sur un Pi 5.

 
dbs0829 9 시간 전

J’utilisais déjà supertonic sur mon agent domestique ; l’ancienne version n’était pas mauvaise non plus, mais elle a donc été mise à jour. Il va falloir que je la teste.