Emu2 - un modèle multimodal open source de 37B similaire à Gemini
(github.com/baaivision)- Dernier modèle multimodal génératif développé par l’Académie d’intelligence artificielle de Pékin (BAAI)
- Conçu pour traiter des tâches de formats variés avec un minimum d’exemples et des consignes simples
- Surpasse des modèles de grande taille comme Flamingo-80B dans les tâches de compréhension multimodale en few-shot
- Modèle de base polyvalent pour les développeurs, offrant une plateforme flexible pour créer des applications multimodales
1 commentaires
Voir le texte de présentation sur HN : https://news.ycombinator.com/item?id=38730143