ppaso-tts : un TTS coréen léger pour les appareils edge
(huggingface.co)Je m’intéresse à l’IA sur des appareils edge autonomes.
Le chipset RK3576 dispose d’un NPU de 6 TOPS, mais alors qu’on voit parfois des modèles TTS anglais légers, il n’existe pratiquement pas de modèles TTS coréens.
Dans le cas de MeloTTS-ko, il a été possible d’utiliser le coréen via une conversion RKNN directe, mais l’encodeur ne pouvait pas être converti en RKNN et la vitesse n’était pas particulièrement élevée.
J’ai donc créé un modèle TTS coréen léger, davantage axé sur la vitesse que sur la qualité, afin qu’il puisse aussi être utilisé sur des appareils edge.
La voix produite reste une voix synthétique un peu peu naturelle, mais la génération vocale en temps réel est possible. (sur RK3576)
Comme il est publié sous licence Apache 2.0, je le partage en espérant que cela puisse aider celles et ceux qui cherchent un TTS coréen plus rapide que qualitatif pour des appareils edge.
Aucun commentaire pour le moment.