- L’auteur parle de son API préférée, à savoir le zipfile du site de la Banque centrale européenne, qui fournit des données historiques sur la position de l’euro par rapport aux autres devises.
- Il montre comment utiliser divers outils comme
curl, gunzip, sqlite3 et pandas pour télécharger, décompresser et interroger les données du zipfile.
- Les données obtenues depuis le zipfile sont au format « wide », avec une colonne de date et des colonnes supplémentaires pour chaque devise, ce qui n’est pas idéal pour les filtres et les agrégations.
- L’auteur utilise
pandas pour transformer les données du format « wide » vers le format « long », c’est-à-dire en effectuant un « melting ».
- Il signale aussi un problème dans les données : une virgule finale à la fin de chaque ligne perturbe le processus de melting. Cela se corrige en ajoutant
.iloc[:, :-1] à la chaîne de méthodes pandas.
- Il reconnaît que le traitement de ces données nécessite un travail de « préparation des données », mais souligne que les données de change de la BCE restent relativement faciles à manipuler par rapport à d’autres publications d’open data.
- Il montre ensuite comment envoyer les données nettoyées dans une table
csvbase et comment tracer un graphique avec gnuplot.
- Il présente aussi un outil appelé DuckDB, similaire à
sqlite mais orienté colonnes, et montre comment l’utiliser pour charger directement un CSV depuis HTTP dans un fichier de table.
- Il souligne que l’open data peut faire office d’API ouverte et salue la simplicité du zipfile de la BCE comme format d’échange de données.
- L’auteur propose également un bref historique de l’euro et explique pourquoi il était faible face au dollar lors de son lancement initial en 2000.
Aucun commentaire pour le moment.