SQL pratique pour l’analyse de données
(hakibenita.com)Exemples d’analyse de données avec SQL au lieu de Pandas
-
Comparaison des performances/de la mémoire entre SQL et Pandas
-
Bases
→ Common Table Expressions
→ Génération de données
→ Génération aléatoire
→ Sélection aléatoire
→ Échantillonnage
-
Statistiques descriptives
-
Création de sous-totaux : Rollup, Cube, regroupement
-
Agrégation cumulée : fonctions de fenêtre, Sliding Window
-
Régression linéaire
-
Interpolation
-
Binning
1 commentaires
Plutôt que de remplacer l’ensemble de l’analyse de données, SQL semble surtout utile ici pour faire le prétraitement, réduire le volume des données et ainsi alléger Pandas, très gourmand en mémoire.