7 points par xguru 2021-03-09 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • La Wikimedia Foundation permet de télécharger l’ensemble des données de Wikipédia

→ fichiers source en wikitexte + métadonnées organisées en XML

→ fichiers de base de données bruts également fournis, structurés au format SQL

→ de nouveaux fichiers de dump sont générés environ tous les un ou deux mois

  • Intégralité de la Wikipédia en coréen

→ à l’heure actuelle, 530 000 articles encyclopédiques et 2,5 millions de pages au total

https://dumps.wikimedia.org/kowiki/20210301/

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.