3 points par GN⁺ 2023-09-16 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • L’auteur parle de son API préférée, à savoir le zipfile du site de la Banque centrale européenne, qui fournit des données historiques sur la position de l’euro par rapport aux autres devises.
  • Il montre comment utiliser divers outils comme curl, gunzip, sqlite3 et pandas pour télécharger, décompresser et interroger les données du zipfile.
  • Les données obtenues depuis le zipfile sont au format « wide », avec une colonne de date et des colonnes supplémentaires pour chaque devise, ce qui n’est pas idéal pour les filtres et les agrégations.
  • L’auteur utilise pandas pour transformer les données du format « wide » vers le format « long », c’est-à-dire en effectuant un « melting ».
  • Il signale aussi un problème dans les données : une virgule finale à la fin de chaque ligne perturbe le processus de melting. Cela se corrige en ajoutant .iloc[:, :-1] à la chaîne de méthodes pandas.
  • Il reconnaît que le traitement de ces données nécessite un travail de « préparation des données », mais souligne que les données de change de la BCE restent relativement faciles à manipuler par rapport à d’autres publications d’open data.
  • Il montre ensuite comment envoyer les données nettoyées dans une table csvbase et comment tracer un graphique avec gnuplot.
  • Il présente aussi un outil appelé DuckDB, similaire à sqlite mais orienté colonnes, et montre comment l’utiliser pour charger directement un CSV depuis HTTP dans un fichier de table.
  • Il souligne que l’open data peut faire office d’API ouverte et salue la simplicité du zipfile de la BCE comme format d’échange de données.
  • L’auteur propose également un bref historique de l’euro et explique pourquoi il était faible face au dollar lors de son lancement initial en 2000.

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.