wav2vec-U : reconnaissance vocale haute performance sans supervision

(ai.facebook.com)

4 points par xguru 2021-05-24 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Framework de reconnaissance vocale créé par l’équipe IA de Facebook
Prend en charge la reconnaissance de diverses langues sans données vocales transcrites

→ performances comparables à celles d’un modèle supervisé entraîné sur environ 100 heures de parole

→ testé sur des langues comme le swahili et le tatar, pour lesquelles les données vocales transcrites sont limitées

→ segmentation des enregistrements vocaux en unités de parole correspondant approximativement à chaque son

→ cat contient trois sons : “/K/”, “/AE/”, “/T/“

→ entraînement avec un GAN composé d’un generator et d’un discriminator

À lire aussi