Supertonic 3 - lancement d’un TTS on-device ultra-léger, avec prise en charge de 31 langues et des balises d’émotion
(github.com/supertone-inc)- Prise en charge de 31 langues, dont le coréen
- Nouvelle prise en charge des balises d’émotion : il est possible d’insérer dans le texte 10 types de balises, comme
<laugh>,<breath>,<scream>, pour exprimer des émotions - Améliorations de la qualité : meilleure précision de prononciation, réduction des échecs de répétition/omission de mots, amélioration des performances de clonage vocal
- Taille du modèle : 99M Parameters
- TTS on-device : confidentialité totale garantie, aucune latence réseau
- Facilité de déploiement : exécutable sur navigateur, PC, mobile, Raspberry Pi, etc.
- 10 voix prédéfinies fournies
- Modèle ouvert : usage commercial autorisé (OpenRAIL-M)
4 commentaires
Je me demande s’il n’est pas difficile de créer sa propre voix plutôt que de se limiter aux 10 préréglages.
Il semble nettement plus stable que les autres modèles légers.
Oh, il va falloir que je teste ça sur un Pi 5.
J’utilisais déjà supertonic sur mon agent domestique ; l’ancienne version n’était pas mauvaise non plus, mais elle a donc été mise à jour. Il va falloir que je la teste.