- Traitement de données à index nommés comme CSV, TSV et JSON tabulaire
→ fournit pour les données clé-valeur des fonctions équivalentes à awk, sed, cut, join et sort
- Utile pour le nettoyage et la réduction de données, la production de statistiques, le DevOps, l’administration système, le traitement de fichiers de logs, la conversion de formats de fichiers et le post-traitement de requêtes de base de données
→ un outil d’appoint pour traiter les sorties de R, Pandas, SQL, etc.
-
Prend en charge le streaming et s’intègre bien aux pipes Unix
-
Traite les données en interne avec une table de hachage à ordre d’insertion
-
Open source : initialement écrit en C, puis passé à Go à partir de la version 6.0
2 commentaires
Je n’en ai pas souvent besoin, mais même en l’utilisant de temps en temps avec la documentation ouverte à côté, je le trouve meilleur que tous les autres outils que j’ai essayés jusqu’à présent !
Ça a l’air bien. Quand il s’agit de traiter de gros fichiers CSV de manière ad hoc, il n’y avait pas vraiment d’outil adapté, et celui-ci semble aussi facile à utiliser.