wav2letter@anywhere, le framework de reconnaissance vocale haute performance publié par Facebook
(ai.facebook.com)Bibliothèque de reconnaissance vocale haute performance, multithread et multiplateforme, qui permet d’intégrer partout wav2letter++, déjà publié auparavant.
Prend en charge les RNN et les CNN (les CNN sont plus rapides).
Code en C++, conçu en pensant au streaming.
Le backend côté serveur est FBGEMM, et des backends pour iOS et Android sont également prévus.
1 commentaires
FBGEMM - https://github.com/pytorch/FBGEMM