19 points par xguru 2021-08-26 | 2 commentaires | Partager sur WhatsApp
  • Traitement de données à index nommés comme CSV, TSV et JSON tabulaire

→ fournit pour les données clé-valeur des fonctions équivalentes à awk, sed, cut, join et sort

  • Utile pour le nettoyage et la réduction de données, la production de statistiques, le DevOps, l’administration système, le traitement de fichiers de logs, la conversion de formats de fichiers et le post-traitement de requêtes de base de données

→ un outil d’appoint pour traiter les sorties de R, Pandas, SQL, etc.

  • Prend en charge le streaming et s’intègre bien aux pipes Unix

  • Traite les données en interne avec une table de hachage à ordre d’insertion

  • Open source : initialement écrit en C, puis passé à Go à partir de la version 6.0

2 commentaires

 
lordmiss 2021-08-27

Je n’en ai pas souvent besoin, mais même en l’utilisant de temps en temps avec la documentation ouverte à côté, je le trouve meilleur que tous les autres outils que j’ai essayés jusqu’à présent !

 
toughrogrammer 2021-08-26

Ça a l’air bien. Quand il s’agit de traiter de gros fichiers CSV de manière ad hoc, il n’y avait pas vraiment d’outil adapté, et celui-ci semble aussi facile à utiliser.