22 points par rbynddd 2026-05-15 | 4 commentaires | Partager sur WhatsApp
  • Prise en charge de 31 langues, dont le coréen
  • Nouvelle prise en charge des balises d’émotion : il est possible d’insérer dans le texte 10 types de balises, comme <laugh>, <breath>, <scream>, pour exprimer des émotions
  • Améliorations de la qualité : meilleure précision de prononciation, réduction des échecs de répétition/omission de mots, amélioration des performances de clonage vocal
  • Taille du modèle : 99M Parameters
  • TTS on-device : confidentialité totale garantie, aucune latence réseau
  • Facilité de déploiement : exécutable sur navigateur, PC, mobile, Raspberry Pi, etc.
  • 10 voix prédéfinies fournies
  • Modèle ouvert : usage commercial autorisé (OpenRAIL-M)

4 commentaires

 
netcleaner 2026-05-16

Je me demande s’il n’est pas difficile de créer sa propre voix plutôt que de se limiter aux 10 préréglages.

 
hshim 2026-05-15

Il semble nettement plus stable que les autres modèles légers.

 
greekr4 2026-05-15

Oh, il va falloir que je teste ça sur un Pi 5.

 
dbs0829 2026-05-15

J’utilisais déjà supertonic sur mon agent domestique ; l’ancienne version n’était pas mauvaise non plus, mais elle a donc été mise à jour. Il va falloir que je la teste.