4 points par xguru 2024-02-13 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Les assistants vocaux IA transforment en profondeur les interactions avec la technologie, mais les échanges avec les assistants vocaux existants peuvent sembler mécaniques et maladroits
  • Ils ont du mal à comprendre et à s’adapter aux nuances et aux dimensions émotionnelles des conversations humaines
  • À quoi ressemblerait un assistant vocal entièrement open source conçu de cette manière ?
    • Répondre en temps réel aux demandes des utilisateurs, avec une voix naturelle, de l’empathie et une intelligence émotionnelle
    • Comprendre le contexte de long terme des conversations précédentes, et gérer les échanges à plusieurs, les interruptions, les confirmations et les pauses pour réfléchir
    • Fonctionner entièrement en local sur du matériel grand public

Développement de BUD-E (Buddy for Understanding and Digital Empathy)

  • LAION a développé BUD-E en collaboration avec l’ELLIS Institute Tübingen, Collabora et le Tübingen AI Center
  • Le projet a commencé par le développement d’un assistant vocal de base à faible latence et, en janvier 2024, a atteint une latence de 300 à 500 ms
  • Avec un modèle plus grand, un temps de réponse inférieur à 300 ms devrait être possible

Feuille de route du développement de BUD-E

  • Même les conversations avec le modèle de base sont bien plus naturelles que tout ce qu’on a vu jusqu’à présent
  • Mais il reste encore de nombreux problèmes à résoudre et des fonctionnalités à développer
    • Réduire la latence et minimiser les exigences système
    • Rendre les conversations plus naturelles et améliorer le naturel des réponses
    • Suivre les conversations sur plusieurs jours, mois ou années
    • Améliorer les fonctionnalités et les capacités de l’assistant vocal
    • Renforcer la compréhension multimodale et du contexte émotionnel
    • Mettre en place l’interface utilisateur, l’intégration continue et une infrastructure de packaging simple
    • Étendre le système au multilingue et au multi-locuteur

Collaborer pour construire l’avenir de l’IA conversationnelle

  • Le développement de BUD-E est un processus continu qui nécessite l’effort collectif de diverses communautés
  • Les développeurs open source, les chercheurs et les passionnés sont invités à améliorer les modules individuels de BUD-E et à contribuer à sa croissance
  • L’objectif est de construire ensemble un assistant vocal IA capable de conversations naturelles, intuitives et empathiques

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.