- Les assistants vocaux IA transforment en profondeur les interactions avec la technologie, mais les échanges avec les assistants vocaux existants peuvent sembler mécaniques et maladroits
- Ils ont du mal à comprendre et à s’adapter aux nuances et aux dimensions émotionnelles des conversations humaines
- À quoi ressemblerait un assistant vocal entièrement open source conçu de cette manière ?
- Répondre en temps réel aux demandes des utilisateurs, avec une voix naturelle, de l’empathie et une intelligence émotionnelle
- Comprendre le contexte de long terme des conversations précédentes, et gérer les échanges à plusieurs, les interruptions, les confirmations et les pauses pour réfléchir
- Fonctionner entièrement en local sur du matériel grand public
Développement de BUD-E (Buddy for Understanding and Digital Empathy)
- LAION a développé BUD-E en collaboration avec l’ELLIS Institute Tübingen, Collabora et le Tübingen AI Center
- Le projet a commencé par le développement d’un assistant vocal de base à faible latence et, en janvier 2024, a atteint une latence de 300 à 500 ms
- Avec un modèle plus grand, un temps de réponse inférieur à 300 ms devrait être possible
Feuille de route du développement de BUD-E
- Même les conversations avec le modèle de base sont bien plus naturelles que tout ce qu’on a vu jusqu’à présent
- Mais il reste encore de nombreux problèmes à résoudre et des fonctionnalités à développer
- Réduire la latence et minimiser les exigences système
- Rendre les conversations plus naturelles et améliorer le naturel des réponses
- Suivre les conversations sur plusieurs jours, mois ou années
- Améliorer les fonctionnalités et les capacités de l’assistant vocal
- Renforcer la compréhension multimodale et du contexte émotionnel
- Mettre en place l’interface utilisateur, l’intégration continue et une infrastructure de packaging simple
- Étendre le système au multilingue et au multi-locuteur
Collaborer pour construire l’avenir de l’IA conversationnelle
- Le développement de BUD-E est un processus continu qui nécessite l’effort collectif de diverses communautés
- Les développeurs open source, les chercheurs et les passionnés sont invités à améliorer les modules individuels de BUD-E et à contribuer à sa croissance
- L’objectif est de construire ensemble un assistant vocal IA capable de conversations naturelles, intuitives et empathiques
Aucun commentaire pour le moment.