Dans les réunions en anglais, il est naturellement plus avantageux d’être à l’aise en anglais. Le timing des prises de parole y est particulièrement important : même si tout est parfaitement formulé dans ma tête, si l’anglais n’est pas ma langue maternelle, je bloque, puis je finis souvent par renoncer à intervenir.
Je me suis dit que ce problème pouvait être résolu grâce aux LLM, qui excellent justement dans la maîtrise du langage, et j’ai donc commencé à créer ce produit.
Ce produit est une application desktop distincte qui peut afficher une fenêtre transparente par-dessus des outils de visioconférence comme Zoom, Google Meet ou Teams.
Elle propose les fonctionnalités clés suivantes.
- Pendant une vraie réunion, elle détecte ce que disent les autres ainsi que l’entrée de mon micro, retranscrit les propos de l’interlocuteur en temps réel et les traduit rapidement.
- Si elle estime qu’un interlocuteur m’a posé une question pendant la réunion, elle le détecte automatiquement et génère une réponse appropriée à afficher.
- Si, pendant la réunion, je ne sais pas comment dire en anglais une phrase ou un mot que je veux exprimer, je peux le taper et obtenir très rapidement une formulation en anglais.
- Une fois la réunion terminée, elle analyse en détail les phrases que j’ai prononcées à partir du contenu de la réunion, puis les reformule toutes sous une forme qu’un locuteur natif utiliserait réellement, avant de fournir un rapport.
Sur le plan technique, l’aspect sur lequel je me suis le plus concentré a été d’obtenir des réponses le plus vite possible. Même avec d’excellentes performances, dans une réunion qui avance à toute vitesse, une information n’a plus aucune utilité après seulement 2 secondes.
Les LLM sont déjà largement assez performants pour assister l’anglais, mais la vitesse de génération des tokens varie énormément selon les modèles, et j’ai passé énormément de temps à trouver le bon équilibre. J’ai testé plusieurs dizaines de foundation models, et j’optimise actuellement le produit en combinant les modèles les plus adaptés à chaque objectif.
Au final, non seulement pour la traduction mais aussi pour les suggestions d’expressions, nous exploitons des LLM tout en obtenant des résultats de qualité à une vitesse de réponse proche du temps réel.
Pendant 3 mois, j’ai mené chaque jour des échanges via KakaoTalk et des entretiens vidéo individuels avec 150 alpha-testeurs, en améliorant le produit un peu chaque semaine, et nous l’avons enfin lancé officiellement.
Cela fait des années que je parcours GeekNews en simple lecteur et que je reçois seulement les notifications Slack, alors le fait d’écrire moi-même ici me rend un peu nerveux... Si le produit vous intéresse, n’hésitez pas à aller le voir via le lien ci-dessous ; vos retours en commentaire me seraient très précieux et d’une grande aide.
Vous pouvez l’essayer gratuitement, sans enregistrer de carte bancaire.
https://trysmooth.ai
Aucun commentaire pour le moment.