- Prise en charge de 31 langues, dont le coréen
- Nouvelle prise en charge des balises d’émotion : il est possible d’insérer dans le texte 10 types de balises, comme
<laugh>, <breath>, <scream>, pour exprimer des émotions
- Améliorations de la qualité : meilleure précision de prononciation, réduction des échecs de répétition/omission de mots, amélioration des performances de clonage vocal
- Taille du modèle : 99M Parameters
- TTS on-device : confidentialité totale garantie, aucune latence réseau
- Facilité de déploiement : exécutable sur navigateur, PC, mobile, Raspberry Pi, etc.
- 10 voix prédéfinies fournies
- Modèle ouvert : usage commercial autorisé (OpenRAIL-M)
3 commentaires
Il semble nettement plus stable que les autres modèles légers.
Oh, il va falloir que je teste ça sur un Pi 5.
J’utilisais déjà supertonic sur mon agent domestique ; l’ancienne version n’était pas mauvaise non plus, mais elle a donc été mise à jour. Il va falloir que je la teste.