3,4 millions de panneaux solaires
(tech.marksblogg.com)- Le jeu de données spatial solaire américain a été converti de GeoPackage vers Parquet, ce qui a permis d’analyser ensemble les installations en toiture, les arrays et les panneaux, avec un total de 3 429 157 enregistrements pour les panneaux
- Les installations en toiture ont été ramenées à 5 822 éléments, et les arrays à 18 980 ; les coordonnées ont été converties en
EPSG:4326, puisbboxet la géométrie WKB ont été stockés ensemble pour les agrégations cartographiques et la visualisation - Pour les installations en toiture comme pour les arrays, la distribution a été comparée entre heatmaps H3 et cartes des sources dominantes ; la couverture et la forme des limites variant selon les sources, les résultats de détection diffèrent même dans une même zone
- Dans les installations en toiture,
modTypeest presque entièrement concentré sur c-si ; dans les données d’arrays, les moyennes et maxima de capacité AC/DC par année d’installation sont agrégés de 1985 à 2025 - La visualisation des panneaux révèle aussi des exceptions où, en plus de vrais panneaux solaires, apparaissent les structures de miroirs de l’Ivanpah Solar Power Facility, ce qui montre à la fois l’utilité et les limites des grands jeux de données de détection
Jeu de données préparé pour l’analyse
- Le fichier ZIP de 3,4 Go est téléchargé via GM-SEUS v2 ZIP download, puis le fichier GeoPackage en est extrait pour utilisation
- La projection du fichier GPKG est confirmée comme étant
+proj=aea +lat_0=23 +lon_0=-96 +lat_1=29.5 +lat_2=45.5 ... +units=m +no_defs - Les données Rooftop arrays, panels et arrays ont chacune été converties au format Parquet, puis les coordonnées ont été passées en
EPSG:4326avec stockage conjoint debboxet de la géométrie WKB- Lors de la conversion, DuckDB v1.4.4 a été utilisé pour les rooftop arrays, alors qu’une exception se produisait avec v1.5.1
- Lors de l’enregistrement, les paramètres
ZSTD,COMPRESSION_LEVEL 22,ROW_GROUP_SIZE 15000ont été utilisés
-
Jeu de données Rooftop arrays
- Le nombre d’enregistrements est de 5 822
- Dans le résumé des colonnes,
areaprésente un taux de NULL de 2,77 %, avec un minimum de 15.0 et un maximum de 487111.0 azimuth,capMWAC,capMWDC,mount,tiltaffichent des taux de NULL élevés de 89,63 %, 89,52 %, 87,12 %, 87,53 %, 90,64 % respectivementinstYra un taux de NULL de 72,43 %, avec des valeurs allant de 2003 à 2025modTypecomporte 2 valeurs distinctes :c-sietthin-filmSourcetotalise 15 valeurs distinctes
-
Jeu de données Panels
- Le nombre d’enregistrements est de 3 429 157
arrayIDa un taux de NULL de 0,03 %, avec environ 12 653 valeurs distinctespanelIDa un taux de NULL de 0,00 % et va jusqu’à 3 429 157pnlSourcecompte 5 valeurs distinctes, etSourceen compte 12rowAreava de 15.01 à 9982.68,rowAzimuthde 90.0 à 540.0,rowLengthde 3.96 à 737.38,rowWidthde 0.45 à 135.33rowSpacea un taux de NULL de 1,27 %, avec des valeurs comprises entre 0.01 et 20.0rowMountcomporte 3 valeurs distinctes
-
Jeu de données Arrays
- Le nombre d’enregistrements est de 18 980
arrayIDcomporte environ 16 914 valeurs distinctes, et sa valeur maximale est 18 980avgAzimuth,avgLength,avgSpace,avgWidthont tous le même taux de NULL, à 32,88 %capMWACatteint un maximum de 1128.931,capMWDCde 1467.61, etcapMWDCestde 1758.501effInita un taux de NULL de 0,07 %, avec des valeurs allant de 0.09 à 0.21instYrcouvre 1985 à 2025, etinstYrEst, avec un taux de NULL de 0,32 %, couvre 2003 à 2025mountcomporte 9 valeurs distinctes,modTypeen comporte 3, etSource10tiltettiltEstont tous deux un taux de NULL de 46,39 %totAreava de 30 à 19 603 313, ettotRowAreade 30 à 8 537 538
Installations solaires en toiture
- Le jeu de données Rooftop arrays a été visualisé en heatmap sur la base du niveau H3 4
- Le nombre d’enregistrements par source est dominé par OSM 2 175, CECSFC 1 835, TZSAM 1 024, USPVDB 485
- S’y ajoutent
GRW 93,GMSEUSdigArraysPanels_v2_0 54,gspt 46,SAM 43,GMSEUSgeoref_v2_0 24,CCVPV 16,GPPDB 15,CWSD 10,InSPIRE 2
- S’y ajoutent
- La source dominante la plus fréquente a été calculée séparément pour chaque hexagone H3 de niveau 3, puis affichée sur la carte
- Dans le tableau croisé
mount/modType,modTypeest presque entièrement concentré sur c-sifixed_axisapparaît commec-si 381,thin-film 2single_axisapparaît commec-si 210,dual_axiscommec-si 33, etunknowncommec-si 98- Les lignes où
mountest NULL sont les plus nombreuses, avecc-si 5096
- Les statistiques de surface par année d’installation n’utilisent que les lignes disposant d’une valeur
instYr, en agrégeant la période 2003–2025- En 2011, on obtient
count 46, une surface moyenne de 41 511 et un maximum de 487 111 - En 2017,
count 105, moyenne 20 882, maximum 315 564 - En 2018,
count 225, soit le plus grand nombre annuel, avec une moyenne de 13 584 et un maximum de 152 636 - En 2025,
count 148, moyenne 12 363, maximum 135 270
- En 2011, on obtient
Empreintes des installations en toiture
- Sur la carte allant de Los Angeles à Long Beach, les résultats de détection sont affichés avec des couleurs par source
- Certaines sources dessinent le contour des bâtiments de manière conservatrice
- D’autres sources utilisent des limites de forme plus organique
- La source
gsptreprésente les détections comme des formes grossièrement circulaires- Dans l’image d’exemple, on voit 4 entrepôts avec des panneaux en toiture, mais la détection n’apparaît que sous la forme de 2 grands cercles
- Dans l’ensemble de Los Angeles, de nombreuses installations en toiture restent non détectées
- Ce jeu de données ne contient qu’environ 5K enregistrements, laissant une large marge pour étendre la couverture
Arrays et panneaux
- Le jeu de données Arrays a lui aussi été visualisé en heatmap sur la base du niveau H3 4
- Le nombre d’enregistrements par source est dominé par OSM 5 222, USPVDB 4 024, TZSAM 3 278, CECSFC 2 288
- Puis viennent
GMSEUSgeoref_v2_0 1 697,GMSEUSdigArraysPanels_v2_0 1 291,GRW 957,CCVPV 155,CWSD 68
- Puis viennent
- La source dominante la plus fréquente a été calculée pour chaque hexagone H3 de niveau 3, puis affichée sur la carte
- Même pour des centrales solaires très proches, les sources de détection peuvent être différentes
- Le jeu de données Arrays ne capture pas toutes les centrales solaires, et certaines sources ne montrent que les limites des arrays sans afficher les panneaux eux-mêmes
- Dans l’exemple
-118.355, 34.837, les panneaux sont affichés en violet
- Dans l’exemple
- Les statistiques de capacité des arrays par année d’installation agrègent ensemble les moyennes, médianes et maxima AC/DC
- En 1985 :
count 1,ACavg 14,DCavg 17 - En 2014 :
count 913,ACavg 6,DCavg 7,ACmax 586,DCmax 752 - En 2020 :
count 1673,ACavg 11,DCavg 15,ACmax 638,DCmax 829 - En 2021 :
count 1705,ACavg 19,DCavg 24, en hausse - En 2023 :
count 2017,ACavg 34,DCavg 44,ACmax 1095,DCmax 1423 - En 2024 :
count 730,ACavg 37,DCavg 44 - En 2025 :
count 152,ACavg 18,DCavg 23,ACmax 1129,DCmax 1468
- En 1985 :
Visualisation des panneaux et éléments atypiques
- Dans un parc solaire de Californie situé à
-115.47, 35.57, le champazimuthest visualisé sous forme de dégradé - Cette détection figure dans le jeu de données panels, mais dans les commentaires Hacker News il est indiqué que la structure n’est pas un panneau mais un miroir, relié à l’Ivanpah Solar Power Facility
- La même forme de visualisation est montrée dans d’autres parcs
- Dans les zones désertiques, de vastes motifs ressemblant à des microchips sont visibles
Aucun commentaire pour le moment.