- Le projet d’IA « innovant » de Facebook, d’une forme totalement inédite
- Un modèle open source capable de fournir immédiatement des traductions de haute qualité, évaluées sur 200 langues, y compris des langues à faibles ressources comme l’asturien, le luganda et l’ourdou
- NLLB vise à offrir à chacun la possibilité d’accéder aux contenus du Web et de les partager dans sa langue maternelle, et de communiquer avec toutes les personnes dans le monde, quelle que soit la langue qu’elles préfèrent
- Applications concrètes
- Appliquer la technologie d’IA à Facebook et Instagram pour la traduction des langues à faibles ressources
- Rendre Wikipédia disponible dans toutes les langues
- Programme de démonstration de traduction par IA : « Stories Told Through Translation »
- Dans les prochains mois, la couverture de traduction devrait être étendue à plus d’une centaine de langues
- NLLB-200 deviendrait ainsi le premier modèle d’IA capable de traduire la littérature à grande échelle
- Technologie : comment le modèle open source NLLB traduit-il directement 200 langues ?
-
- Construction automatique du jeu de données : collecte de données d’entraînement contenant des phrases dans la langue d’entrée et la langue de sortie souhaitée
-
- Entraînement : après avoir créé des données d’entraînement ajustées à des milliers de consignes d’apprentissage, ces données sont injectées dans le pipeline d’entraînement des modèles de Meta
- Un encodeur qui convertit en représentations vectorielles internes, et un décodeur qui utilise ces représentations vectorielles internes pour générer avec précision les phrases de sortie
-
- Évaluation : le modèle est évalué en le comparant à des ensembles de phrases traduites par des humains afin de vérifier si la qualité de traduction est satisfaisante
- Utilisation de listes de langage nuisible créées pour toutes les langues prises en charge afin de détecter et filtrer les grossièretés et autres contenus offensants
- Résultat : un modèle bien entraîné capable de traduire directement d’une langue à une autre
Aucun commentaire pour le moment.