7 points par xguru 2023-07-03 | 1 commentaires | Partager sur WhatsApp
  • Une implémentation open source du modèle Flamingo de DeepMind
  • Publication des modèles 3B, 4B et 9B
    • Basés sur MPT-1B/7B et RedPajama-3B
  • Atteint plus de 80 % des performances du modèle Flamingo original
  • Amélioration du code d’entraînement et d’évaluation
    • Prise en charge de Fully Sharded Data Parallel (FSDP)
    • Ajout de nouveaux jeux de données à la suite d’évaluation : TextVQA, VizWiz, HatefulMemes, Flickr30k