8 points par xguru 2022-09-01 | 1 commentaires | Partager sur WhatsApp
  • Un vaste jeu de données d’entraînement comprenant environ 740 millions de paires image-texte ainsi que de nombreux autres attributs
  • Collecte des images présentes dans des documents HTML et de leur attribut alt (la chaîne de caractères affichée lorsqu’une image ne peut pas être rendue à l’écran dans du HTML)
  • Devrait compléter d’autres jeux de données similaires et être utilisé pour entraîner des modèles fondamentaux à grande échelle
  • « COYO » a déjà été appliqué au développement du modèle de génération d’images par IA à très grande échelle RQ-Transformer et de l’artiste IA Karlo, précédemment dévoilés
  • Les détails du processus de collecte des données seront disponibles dans un article à paraître