4 points par xguru 2020-01-02 | 2 commentaires | Partager sur WhatsApp

Un outil CLI qui permet d’utiliser des fichiers CSV comme une base de données. Open source en Rust

Fusion de fichiers, comptage du nombre de lignes, création de largeur fixe, reformatage (changement de délimiteur, etc.),

join (inner, outer, cross), partitionnement par valeur de colonne, échantillonnage, ordre inverse, extraction de colonnes spécifiques, réorganisation des colonnes,

tri, découpage (en N fichiers), stats (moyenne, variance, médiane, étendue, etc. pour chaque colonne), affichage sous forme de tableau

2 commentaires

 
iolothebard 2020-01-02

spark en local ?!

 
xguru 2020-01-02

Cela semble pratique pour nettoyer des données CSV lors de l’analyse de données.

Exemple de jointure au format SQL - https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/