Mozilla Common Voice
(voice.mozilla.org)Une base de données vocale open source qui collecte et affine des données dans diverses langues afin de créer une technologie de reconnaissance vocale utilisable par tous et de la rendre accessible.
Les données en coréen restent encore très insuffisantes. Participez et construisons-la ensemble.
La plupart des jeux de données vocaux créés par les entreprises sont difficiles à utiliser à l’extérieur.
C’est pourquoi les données créées de manière ouverte sont importantes. Et c’est encore plus vrai pour le coréen.
7 commentaires
Je ne peux pas continuer, car il n’y a pas de coréen dans la section de configuration de l’objectif..
Donc, si le dataset coréen n'était pas encore disponible, c'est parce qu'il manquait encore la localisation du site des phrases ou un ensemble de phrases suffisant.
Traduction coréenne du site : https://pontoon.mozilla.org/projects/common-voice/
Site de collecte de phrases : https://common-voice.github.io/sentence-collector
Il semble qu’une fois la traduction du site terminée et plus de 5 000 phrases collectées, la collecte et la validation des voix deviennent possibles. Merci d’avance pour la participation de toutes les personnes intéressées.
J’ai posté exactement le même commentaire puis je l’ai supprimé haha
https://discourse.mozilla.org/t/…
C’est expliqué comme ça ici.
Ah… oui haha, moi aussi, j’ai été surpris en essayant de le supprimer parce qu’il n’y avait pas de bouton de suppression..
Il semble qu’il y ait quelques corpus en coréen à ce sujet, mais je ne sais pas si je peux les publier à cause des questions de droits d’auteur.
Ah, pour supprimer un commentaire, il suffit de cliquer sur le lien de l’heure à côté de l’identifiant au-dessus du commentaire, puis la suppression est possible depuis la page du commentaire.
Parmi les projets open source de reconnaissance vocale en coréen déjà publiés, il y a aussi le projet Zeroth basé sur Kaldi.
(D'après le contenu du dépôt GitHub, le modèle final semble être la version de juillet 2018.)
https://github.com/goodatlas/zeroth