ImageBind - le modèle d’IA multimodal de Meta
(imagebind.metademolab.com)- Permet de lier simultanément des données de 6 modalités sans supervision, pour mieux analyser différents types d’informations
- image, vidéo, audio, texte, profondeur, thermique (Thermal), IMU (unité de mesure inertielle)
- il est possible de générer des images à partir du son, ou d’effectuer des recherches d’information en combinant des données audio/vidéo/image/profondeur
- Excellentes performances de reconnaissance en zero-shot / few-shot
Aucun commentaire pour le moment.