4 points par GN⁺ 2026-02-23 | 1 commentaires | Partager sur WhatsApp
  • Archive d'information open source structurée à partir des données du CIA World Factbook de 1990 à 2025, permettant la recherche et l’analyse
  • Comprend 281 pays et territoires, 36 éditions annuelles et plus d’un million de champs de données
  • Propose des profils pays par année, des données en séries temporelles, une recherche en texte intégral et des fonctions d’analyse des réseaux géographiques, de communication et commerciaux
  • Inclut des outils d’analyse comme un tableau de bord basé sur les régions COCOM, la comparaison d’indicateurs entre pays et la visualisation des tendances mondiales
  • Basé sur des documents du domaine public, il s’agit d’un projet indépendant sans lien avec la CIA ni le gouvernement américain

Aperçu

  • Archive de données qui préserve et structure 36 ans d’informations géopolitiques
    • Basée sur des données extraites du CIA World Factbook original
    • Inclut 281 entités, 36 éditions, 9 500 enregistrements pays-année et 1 061 341 champs de données
  • Toutes les données sont interrogeables, et il est possible de suivre l’évolution des rapports par pays d’une année à l’autre

Composition de la plateforme

  • Factbook Archive / Reference Library
    • Consultation de toutes les éditions de 1990 à 2025
    • Affichage des données de champ originales telles quelles, avec recherche des évolutions annuelles
  • Intelligence Analysis / Analytic Workspace
    • Espace d’analyse organisé par régions des commandements combattants du DoD (COCOM)
    • Fournit des cartes choroplèthes, des comparaisons temporelles, des dossiers d’analyse par pays (format ICD 203) et des fonctions de comparaison entre indicateurs

Fonctionnalités principales

  • Library : classification de toutes les entités par type, avec drapeaux
  • Country Profile : consultation de l’ensemble des champs de données de chaque pays
  • Full-Text Search : recherche par mots-clés dans plus d’un million de champs avec la syntaxe Z39.58
  • Field Time Series : suivi sur 36 ans d’un champ de données spécifique
  • Factbook Quiz : quiz de culture générale mondiale en 4 modes
  • Factbook Export : génération de rapports pays imprimables avec tous les champs

Outils d’analyse du renseignement

  • Regional Dashboard : carte du monde avec affichage des régions COCOM et des capitales
  • Timeline Map : visualisation animée des données sur 36 ans
  • Communications Analysis : affichage d’indicateurs sur les taux de pénétration d’Internet, du mobile et du haut débit
  • Map Compare : comparaison synchronisée de cartes de deux années
  • COCOM Region Detail : affichage des principaux indicateurs (KPI) par région
  • Intelligence Dossier : dossier d’analyse par pays selon les critères ICD 203
  • Global Rankings : classement des pays par indicateur
  • Global Trends : tendances mondiales des indicateurs à travers toutes les éditions
  • Compare Countries : comparaison d’indicateurs entre pays
  • Field Explorer : exploration de tous les champs de données et des statistiques de couverture
  • Change Detection : détection des changements de champ d’une année à l’autre
  • Dissolved States : informations sur les pays et territoires qui n’existent plus
  • Trade Networks : graphe des réseaux de relations commerciales
  • Organization Networks : graphe des relations d’adhésion aux organisations internationales
  • Query Builder : création de requêtes d’analyse personnalisées
  • Text Diff : comparaison de textes par année et mise en évidence des modifications

Informations sur le projet

  • Toutes les données sont collectées à partir de documents du domaine public du gouvernement américain (CIA World Factbook)
  • Aucun lien avec la CIA ni le gouvernement américain
  • Les analyses suivent les normes d’analyse ICD 203
  • Source et méthodologie publiées via le dépôt GitHub

1 commentaires

 
GN⁺ 2026-02-23
Réactions sur Hacker News
  • On dirait que l’administration actuelle a supprimé toutes les données internes du CIA World Factbook pour empêcher toute tentative future de restauration
    Ce serait vraiment génial si la prochaine administration s’appuyait sur ces données archivées pour le reconstruire
  • C’est exactement comme ça que Show HN devrait fonctionner
    Quelqu’un publie un projet, la communauté trouve les bugs en temps réel, et le créateur les corrige aussitôt
    Le conflit entre les codes pays FIPS et ISO est un bon exemple de ces bugs rares qu’on ne peut repérer qu’avec de nombreux regards
    J’ai trouvé impressionnant que l’auteur ne soit pas sur la défensive et réagisse activement aux retours
  • Il existe un dépôt GitHub pour ceux qui ont besoin des fichiers JSON ou Markdown du Factbook
    Il est décrit comme un « cache de jeux de données de profils pays au format original (1:1) de CIA.gov »
    Les données détaillées sont disponibles dans cache.factbook.json
    • Merci pour le lien ! Mon GitHub et mon site web utilisent aussi cette source
      Mais je pensais qu’il fallait transformer les données 1990–2025 en base de données SQL pour les rendre interrogeables
  • Pour l’auteur : si vous êtes en train de corriger des champs de la base de données ou des bugs (par ex. les codes pays), je me demande si vous pourriez aussi partager cette version
    Ce jeu de données est parfait pour tester les fonctionnalités de GraphRAG
    On pourrait même créer un jeu de simulation du monde basé sur des données réelles
    • Bien sûr ! Toutes les corrections de données sont gérées dans un journal des modifications .txt
      Le contenu original publié par la CIA est conservé tel quel, et seul le bruit de formatage est nettoyé pendant le parsing
      J’ai aussi créé une table de correspondance reliant les codes FIPS 10-4, les ISO Alpha-2/3 et MasterCountryID pour pouvoir les relier entre eux
      Je prévois d’ajouter aussi ces ressources sur GitHub
  • Super projet. Mais j’ai repéré un problème
    Si on clique sur l’entrée « Germany » dans le Factbook 2002, on arrive à chaque fois sur la page « Gambia »
    Je n’ai pas vu ce phénomène pour d’autres pays
    • Autre exemple : si on recherche « Nicaragua », on tombe sur la page « Niger »
  • La version 2025–2026 est déjà disponible à l’achat et consultable, et l’édition 2026–2027 doit sortir le 7 avril
    Lien Amazon
    • Je ne savais pas que ce genre de livre était réellement publié. Merci de l’info
    • Internet Archive possède l’édition 2025–2026, qui sera numérisée puis ajoutée à OpenLibrary
    • Je l’ajouterai aussi à mon projet dès sa sortie. Merci pour l’information
  • Ce lien est vraiment impressionnant : page d’analyse de l’historique des changements
  • Super projet. Mais on dirait que la population mondiale est comptée en double
    On peut le voir sur la page d’analyse des tendances
    • J’ai trouvé la cause. L’entité « World » (environ 8 milliards d’habitants) était additionnée avec les pays individuels, ce qui doublait le total
      Merci pour le signalement !
    • Je suis justement en train de corriger ça. À force d’avoir trop regardé le projet, j’ai dû passer à côté. Merci de l’avoir signalé
  • Ce projet est donc une archive qui préserve un service interrompu par l’administration de la Maison-Blanche actuelle ?
    • Oui, c’est exactement ce service-là
  • Il y a un bug dans le graphique chronologique. Il faut faire une normalisation des données avant de les visualiser
    Exemple : données sur les abonnements au haut débit fixe en Inde
    • J’ai trouvé le problème. La regex qui parsait les totaux ne gérait pas les suffixes d’unité (million, billion, etc.)
      Par exemple, « 18.17 million » était interprété seulement comme 18.17, ce qui provoquait une chute brutale sur le graphique
      J’ai ajouté la gestion des unités, corrigé le bug et je viens de déployer le correctif
      Merci pour le signalement