ONE-PEACE : modèle de représentation général pour une multimodalité illimitée
(github.com/OFA-Sys)- Modèle de représentation général couvrant à la fois les modalités vision, audio et langage
- Obtient d’excellents résultats sur des tâches unifiées même sans modèles préentraînés
- Un puissant Zero-shot Retrieval émergent permet d’aligner des modalités non appariées dans les données d’entraînement
- Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image
3 commentaires
Ah, il semble que ce soit le même que celui que vous aviez publié la semaine dernière. +_+
https://fr.news.hada.io/topic?id=9249
Oups, j’ai copié quelque chose qui n’avait rien à voir, snif. Comme cela a aussi été partagé sur Slack, je vais le laisser tel quel
(Puisque c’est important, considérez que vous le lisez deux fois… snif snif)
Oui, merci ! 🙇🏼♂️
(Grâce à vous, j’ai compris que xguru allait le publier lui-même ! 🤣)