Je travaille dans une entreprise de traduction pour les médias et nous proposons un éditeur de sous-titres.
L’éditeur dispose d’une fonction de correction orthographique, et nous convertissons l’ensemble des sous-titres en texte pour appeler l’API (en les découpant).
Nous utilisons actuellement l’API de Bing, mais les performances sont vraiment médiocres. Elle ne détecte pas ce qu’elle devrait détecter, et signale ce qu’elle ne devrait pas signaler.
Voici les alternatives que nous avons essayées :
- le correcteur orthographique AWS est très difficile à utiliser, car un appel est limité à 20 caractères ;
- Grammarly a mis fin à la prise en charge de son API l’an dernier ;
- nous avons testé https://sapling.ai/ , mais la qualité était au contraire meilleure avec Bing ;
- nous avons également testé tout ce qui se trouve ici : https://rapidapi.com/collection/grammar-spellcheck-api , mais difficile de dire que c’était vraiment meilleur que Bing.
Même si ce n’est pas forcément « multilingue », ce serait déjà bien si cela fonctionnait bien au moins en anglais, mais il n’y a pas vraiment beaucoup de bonnes alternatives. Même si ce n’est pas une recommandation de produit, je vous serais reconnaissant de partager votre expérience si vous avez déjà mis en place un correcteur orthographique.
1 commentaires
https://huggingface.co/mzbac/mistral-grammar/tree/main
Comme il était question de multilingue, j’ai cherché du côté de la famille Mistral et je suis tombé sur ceci, mais je ne sais pas vraiment si cela répond au niveau d’exigence d’un produit en production...
Il semble avoir été fine-tuné pour l’anglais ; pourquoi ne pas essayer ce modèle ?