- Archive d'information open source structurée à partir des données du CIA World Factbook de 1990 à 2025, permettant la recherche et l’analyse
- Comprend 281 pays et territoires, 36 éditions annuelles et plus d’un million de champs de données
- Propose des profils pays par année, des données en séries temporelles, une recherche en texte intégral et des fonctions d’analyse des réseaux géographiques, de communication et commerciaux
- Inclut des outils d’analyse comme un tableau de bord basé sur les régions COCOM, la comparaison d’indicateurs entre pays et la visualisation des tendances mondiales
- Basé sur des documents du domaine public, il s’agit d’un projet indépendant sans lien avec la CIA ni le gouvernement américain
Aperçu
- Archive de données qui préserve et structure 36 ans d’informations géopolitiques
- Basée sur des données extraites du CIA World Factbook original
- Inclut 281 entités, 36 éditions, 9 500 enregistrements pays-année et 1 061 341 champs de données
- Toutes les données sont interrogeables, et il est possible de suivre l’évolution des rapports par pays d’une année à l’autre
Composition de la plateforme
- Factbook Archive / Reference Library
- Consultation de toutes les éditions de 1990 à 2025
- Affichage des données de champ originales telles quelles, avec recherche des évolutions annuelles
- Intelligence Analysis / Analytic Workspace
- Espace d’analyse organisé par régions des commandements combattants du DoD (COCOM)
- Fournit des cartes choroplèthes, des comparaisons temporelles, des dossiers d’analyse par pays (format ICD 203) et des fonctions de comparaison entre indicateurs
Fonctionnalités principales
- Library : classification de toutes les entités par type, avec drapeaux
- Country Profile : consultation de l’ensemble des champs de données de chaque pays
- Full-Text Search : recherche par mots-clés dans plus d’un million de champs avec la syntaxe Z39.58
- Field Time Series : suivi sur 36 ans d’un champ de données spécifique
- Factbook Quiz : quiz de culture générale mondiale en 4 modes
- Factbook Export : génération de rapports pays imprimables avec tous les champs
Outils d’analyse du renseignement
- Regional Dashboard : carte du monde avec affichage des régions COCOM et des capitales
- Timeline Map : visualisation animée des données sur 36 ans
- Communications Analysis : affichage d’indicateurs sur les taux de pénétration d’Internet, du mobile et du haut débit
- Map Compare : comparaison synchronisée de cartes de deux années
- COCOM Region Detail : affichage des principaux indicateurs (KPI) par région
- Intelligence Dossier : dossier d’analyse par pays selon les critères ICD 203
- Global Rankings : classement des pays par indicateur
- Global Trends : tendances mondiales des indicateurs à travers toutes les éditions
- Compare Countries : comparaison d’indicateurs entre pays
- Field Explorer : exploration de tous les champs de données et des statistiques de couverture
- Change Detection : détection des changements de champ d’une année à l’autre
- Dissolved States : informations sur les pays et territoires qui n’existent plus
- Trade Networks : graphe des réseaux de relations commerciales
- Organization Networks : graphe des relations d’adhésion aux organisations internationales
- Query Builder : création de requêtes d’analyse personnalisées
- Text Diff : comparaison de textes par année et mise en évidence des modifications
Informations sur le projet
- Toutes les données sont collectées à partir de documents du domaine public du gouvernement américain (CIA World Factbook)
- Aucun lien avec la CIA ni le gouvernement américain
- Les analyses suivent les normes d’analyse ICD 203
- Source et méthodologie publiées via le dépôt GitHub
1 commentaires
Réactions sur Hacker News
Ce serait vraiment génial si la prochaine administration s’appuyait sur ces données archivées pour le reconstruire
Quelqu’un publie un projet, la communauté trouve les bugs en temps réel, et le créateur les corrige aussitôt
Le conflit entre les codes pays FIPS et ISO est un bon exemple de ces bugs rares qu’on ne peut repérer qu’avec de nombreux regards
J’ai trouvé impressionnant que l’auteur ne soit pas sur la défensive et réagisse activement aux retours
Il est décrit comme un « cache de jeux de données de profils pays au format original (1:1) de CIA.gov »
Les données détaillées sont disponibles dans cache.factbook.json
Mais je pensais qu’il fallait transformer les données 1990–2025 en base de données SQL pour les rendre interrogeables
Ce jeu de données est parfait pour tester les fonctionnalités de GraphRAG
On pourrait même créer un jeu de simulation du monde basé sur des données réelles
Le contenu original publié par la CIA est conservé tel quel, et seul le bruit de formatage est nettoyé pendant le parsing
J’ai aussi créé une table de correspondance reliant les codes FIPS 10-4, les ISO Alpha-2/3 et MasterCountryID pour pouvoir les relier entre eux
Je prévois d’ajouter aussi ces ressources sur GitHub
Si on clique sur l’entrée « Germany » dans le Factbook 2002, on arrive à chaque fois sur la page « Gambia »
Je n’ai pas vu ce phénomène pour d’autres pays
Lien Amazon
On peut le voir sur la page d’analyse des tendances
Merci pour le signalement !
Exemple : données sur les abonnements au haut débit fixe en Inde
Par exemple, « 18.17 million » était interprété seulement comme 18.17, ce qui provoquait une chute brutale sur le graphique
J’ai ajouté la gestion des unités, corrigé le bug et je viens de déployer le correctif
Merci pour le signalement