6 points par xguru 2023-08-25 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Un jeu de données créé par l’Allen Institute for AI
  • Un mélange de contenus web, publications académiques, code, livres et ressources encyclopédiques
  • Avec 3 billions (Trillion) de tokens, il s’agit du plus grand jeu de données public publié à ce jour
  • Téléchargeable depuis le hub HuggingFace
  • Licence AI2 ImpACT (classification Low/Medium/High selon le niveau de risque de l’artifact)

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.