Une nouvelle percée dans la technologie de lecture de l’esprit
- Des chercheurs du centre d’IA centrée sur l’humain GrapheneX-UTS de l’Université de technologie de Sydney ont annoncé une nouvelle percée dans la technologie de « lecture de l’esprit ».
- Cette recherche a réussi à convertir des pensées en mots affichés à l’écran, et est considérée comme un effort pionnier de traduction directe d’ondes EEG brutes en langage.
- En introduisant une technique de codage discret dans le processus de traduction des ondes cérébrales en texte, ainsi qu’une intégration avec un grand modèle de langage, elle ouvre de nouvelles perspectives en neurosciences et en IA.
Technologie de traduction du langage à partir des ondes cérébrales
- Pendant que les participants lisaient silencieusement un texte, le modèle d’IA DeWave projetait des mots à l’écran en n’utilisant comme entrée que leurs ondes cérébrales.
- Cette technologie est la seule capable de traduire des signaux cérébraux en langage sans nécessiter d’implant cérébral ni l’accès à une machine IRM complète.
- Contrairement aux technologies précédentes, qui exigeaient des entrées supplémentaires comme un logiciel de suivi oculaire, cette nouvelle technologie peut être utilisée sans ces fonctions additionnelles.
Aspect pratique et simplicité d’usage
- L’utilisateur n’a qu’à porter une coiffe enregistrant l’activité cérébrale via EEG, ce qui est bien plus pratique et commode qu’un dispositif de suivi oculaire ou une machine IRM.
- Les chercheurs ont reconnu que le signal était un peu plus bruité que les informations obtenues à partir d’implants, mais ont indiqué que la technologie avait obtenu des résultats assez satisfaisants lors des tests.
- Dans la mesure de précision utilisant l’algorithme BLEU, cette technologie a obtenu un score d’environ 0,4.
Possibilités d’amélioration de la précision
- Le modèle est plus performant pour faire correspondre les verbes, mais pour les noms, il a tendance à privilégier des paires synonymiques, comme « homme » au lieu de « écrivain ».
- Les chercheurs pensent que, lorsque le cerveau traite ces mots, des termes sémantiquement proches peuvent produire des schémas d’ondes cérébrales similaires.
- Les chercheurs estiment qu’il sera possible d’améliorer la précision jusqu’à 0,9, soit un niveau comparable à celui des programmes traditionnels de traduction linguistique.
- L’équipe a mené l’expérience sur 29 participants, un chiffre bien supérieur à celui des tests d’autres technologies de décodage.
L’avis de GN⁺
- Cette technologie représente une avancée remarquable dans la traduction directe des pensées humaines en langage à partir des ondes cérébrales.
- Son accessibilité, puisqu’elle peut être utilisée avec une simple coiffe EEG sans implant cérébral ni machine complexe, en fait une innovation particulièrement marquante.
- À l’avenir, cette technologie pourrait grandement aider les personnes souffrant de troubles de la communication et porter l’interaction entre l’humain et la machine à un niveau inédit.
1 commentaires
Avis Hacker News
La recherche sur les interfaces cerveau-ordinateur (BCI) se concentre principalement sur l’aide aux patients paralysés pour qu’ils retrouvent la capacité de communiquer.
Ce n’est pas la première technologie capable de traduire des signaux cérébraux en langage, mais c’est la seule qui ne nécessite ni implant cérébral ni accès à un appareil d’IRM complet.
Cette technologie pourrait aussi aider à l’introspection.
Le projet « Silent Talk » de la DARPA a démarré il y a 14 ans et visait à permettre la communication entre utilisateurs sans échange verbal en situation de combat, grâce à l’analyse des signaux neuronaux.
Cette technologie pourrait aider les patients victimes d’AVC, mais elle pourrait aussi laisser échapper des pensées non filtrées, ce qui poserait problème.
Prédire des pensées à l’aide de l’EEG revient un peu à essayer de prévoir les nuages à Austin en observant ceux de Mumbai. Les signaux électriques des neurones individuels se perdent dans des oscillations à grande échelle, puis sont encore plus brouillés par les couches d’os, de muscles et de tissus entre le cerveau et l’appareil. Le débit binaire est d’environ 1 bit par seconde, ce qui est totalement insuffisant pour la plupart des usages.
La version de base de ce modèle comporte un bug dans le code, ce qui a gonflé les résultats de référence, et le problème est en cours d’investigation.
On se demande si des pensées non verbales pourraient aussi fonctionner. Par exemple, il serait peut-être possible de comprendre les pensées ou les rêves d’un chien à partir d’un jeu de données de signaux liés à des activités quotidiennes.
En laissant de côté toutes les implications terrifiantes, cette technologie pourrait permettre quelque chose de très impressionnant : une communication mentale bidirectionnelle.