Sortie d’OpenFlamingo V2

xguru · 2023-07-03T10:32:01+09:00

Une implémentation open source du modèle Flamingo de DeepMind Publication des modèles 3B, 4B et 9B Basés sur MPT-1B/7B et RedPajama-3B Atteint plus de 80 % des performances du modèle Flamingo original Amélioration du code d’entraînement et d’évaluation Prise en charge de Fully Sharded Data Parallel (FSDP) Ajout de nouveaux jeux de données à la suite d’évaluation : TextVQA, VizWiz, HatefulMemes, Flickr30k

(laion.ai)

7 points par xguru 2023-07-03 | 1 commentaires | Partager sur WhatsApp

Une implémentation open source du modèle Flamingo de DeepMind
Publication des modèles 3B, 4B et 9B
- Basés sur MPT-1B/7B et RedPajama-3B
Atteint plus de 80 % des performances du modèle Flamingo original
Amélioration du code d’entraînement et d’évaluation
- Prise en charge de Fully Sharded Data Parallel (FSDP)
- Ajout de nouveaux jeux de données à la suite d’évaluation : TextVQA, VizWiz, HatefulMemes, Flickr30k

1 commentaires

xguru 2023-07-03

OpenFlamingo - framework open source pour entraîner/évaluer des grands modèles multimodaux (LMM)

Sortie d’OpenFlamingo V2

À lire aussi

1 commentaires