2 points par kapitalismho 5 시간 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Résumé rapide
Q : Alors, les performances sont-elles suffisantes pour converser naturellement avec des étrangers ?
R : Oui. Regardez la vidéo de démonstration dans le dépôt GitHub. (Ou sur la page Faerii plus bas)

Bonjour.

C’est un projet que j’ai commencé en me disant que je voulais avoir des conversations plus profondes avec des amis étrangers rencontrés en réalité virtuelle.

La devise est une traduction en temps réel que tout le monde peut utiliser sans contrainte.
C’est pourquoi j’ai longuement réfléchi à la meilleure façon d’obtenir un maximum de performances tout en trouvant un équilibre sur les trois points ci-dessous.


  • Qualité de traduction => taux de contresens 6 fois inférieur à DeepL
  • Latence => moins de 2 secondes
  • Accessibilité et coût => open source / 0,1 à 0,5 won par prise de parole
    (Base Gemma 4 26B A4B)

Les données circulent sous la forme voix => ASR => LLM => texte traduit,
et il est possible de faire de la traduction bidirectionnelle en traduisant à la fois ses propres paroles et celles de l’interlocuteur.

La vidéo dans le dépôt GitHub montre une utilisation réelle.
La plateforme utilisée dans la vidéo est VRChat.

Nous sommes encore dans cette phase transitoire du début,
où l’on n’a pas encore besoin de douter que quelqu’un derrière un écran soit une vraie personne.
J’espère que ce programme pourra aider à se relier à quelqu’un au-delà de la langue.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.