- Un vaste jeu de données d’entraînement comprenant environ 740 millions de paires image-texte ainsi que de nombreux autres attributs
- Collecte des images présentes dans des documents HTML et de leur attribut
alt (la chaîne de caractères affichée lorsqu’une image ne peut pas être rendue à l’écran dans du HTML)
- Devrait compléter d’autres jeux de données similaires et être utilisé pour entraîner des modèles fondamentaux à grande échelle
- « COYO » a déjà été appliqué au développement du modèle de génération d’images par IA à très grande échelle
RQ-Transformer et de l’artiste IA Karlo, précédemment dévoilés
- Les détails du processus de collecte des données seront disponibles dans un article à paraître
1 commentaires
COYO-700M: jeu de données de paires image-texte
Kakao Brain dévoile « COYO », un jeu de données de rang mondial