ONE-PEACE : modèle de représentation général pour une multimodalité illimitée

xguru · 2023-05-31T10:18:01+09:00

Modèle de représentation général couvrant à la fois les modalités vision, audio et langage Obtient d’excellents résultats sur des tâches unifiées même sans modèles préentraînés Un puissant Zero-shot Retrieval émergent permet d’aligner des modalités non appariées dans les données d’entraînement Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

(github.com/OFA-Sys)

3 points par xguru 2023-05-31 | 3 commentaires | Partager sur WhatsApp

Modèle de représentation général couvrant à la fois les modalités vision, audio et langage
Obtient d’excellents résultats sur des tâches unifiées même sans modèles préentraînés
Un puissant Zero-shot Retrieval émergent permet d’aligner des modalités non appariées dans les données d’entraînement
Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

3 commentaires

ninebow 2023-05-31

Ah, il semble que ce soit le même que celui que vous aviez publié la semaine dernière. +_+
https://fr.news.hada.io/topic?id=9249

xguru 2023-05-31

Oups, j’ai copié quelque chose qui n’avait rien à voir, snif. Comme cela a aussi été partagé sur Slack, je vais le laisser tel quel
(Puisque c’est important, considérez que vous le lisez deux fois… snif snif)

ninebow 2023-05-31

Oui, merci ! 🙇🏼‍♂️
(Grâce à vous, j’ai compris que xguru allait le publier lui-même ! 🤣)

ONE-PEACE : modèle de représentation général pour une multimodalité illimitée

À lire aussi

3 commentaires