2 points par GN⁺ 7 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Le jeu de données spatial solaire américain a été converti de GeoPackage vers Parquet, ce qui a permis d’analyser ensemble les installations en toiture, les arrays et les panneaux, avec un total de 3 429 157 enregistrements pour les panneaux
  • Les installations en toiture ont été ramenées à 5 822 éléments, et les arrays à 18 980 ; les coordonnées ont été converties en EPSG:4326, puis bbox et la géométrie WKB ont été stockés ensemble pour les agrégations cartographiques et la visualisation
  • Pour les installations en toiture comme pour les arrays, la distribution a été comparée entre heatmaps H3 et cartes des sources dominantes ; la couverture et la forme des limites variant selon les sources, les résultats de détection diffèrent même dans une même zone
  • Dans les installations en toiture, modType est presque entièrement concentré sur c-si ; dans les données d’arrays, les moyennes et maxima de capacité AC/DC par année d’installation sont agrégés de 1985 à 2025
  • La visualisation des panneaux révèle aussi des exceptions où, en plus de vrais panneaux solaires, apparaissent les structures de miroirs de l’Ivanpah Solar Power Facility, ce qui montre à la fois l’utilité et les limites des grands jeux de données de détection

Jeu de données préparé pour l’analyse

  • Le fichier ZIP de 3,4 Go est téléchargé via GM-SEUS v2 ZIP download, puis le fichier GeoPackage en est extrait pour utilisation
  • La projection du fichier GPKG est confirmée comme étant +proj=aea +lat_0=23 +lon_0=-96 +lat_1=29.5 +lat_2=45.5 ... +units=m +no_defs
  • Les données Rooftop arrays, panels et arrays ont chacune été converties au format Parquet, puis les coordonnées ont été passées en EPSG:4326 avec stockage conjoint de bbox et de la géométrie WKB
    • Lors de la conversion, DuckDB v1.4.4 a été utilisé pour les rooftop arrays, alors qu’une exception se produisait avec v1.5.1
    • Lors de l’enregistrement, les paramètres ZSTD, COMPRESSION_LEVEL 22, ROW_GROUP_SIZE 15000 ont été utilisés
  • Jeu de données Rooftop arrays

    • Le nombre d’enregistrements est de 5 822
    • Dans le résumé des colonnes, area présente un taux de NULL de 2,77 %, avec un minimum de 15.0 et un maximum de 487111.0
    • azimuth, capMWAC, capMWDC, mount, tilt affichent des taux de NULL élevés de 89,63 %, 89,52 %, 87,12 %, 87,53 %, 90,64 % respectivement
    • instYr a un taux de NULL de 72,43 %, avec des valeurs allant de 2003 à 2025
    • modType comporte 2 valeurs distinctes : c-si et thin-film
    • Source totalise 15 valeurs distinctes
  • Jeu de données Panels

    • Le nombre d’enregistrements est de 3 429 157
    • arrayID a un taux de NULL de 0,03 %, avec environ 12 653 valeurs distinctes
    • panelID a un taux de NULL de 0,00 % et va jusqu’à 3 429 157
    • pnlSource compte 5 valeurs distinctes, et Source en compte 12
    • rowArea va de 15.01 à 9982.68, rowAzimuth de 90.0 à 540.0, rowLength de 3.96 à 737.38, rowWidth de 0.45 à 135.33
    • rowSpace a un taux de NULL de 1,27 %, avec des valeurs comprises entre 0.01 et 20.0
    • rowMount comporte 3 valeurs distinctes
  • Jeu de données Arrays

    • Le nombre d’enregistrements est de 18 980
    • arrayID comporte environ 16 914 valeurs distinctes, et sa valeur maximale est 18 980
    • avgAzimuth, avgLength, avgSpace, avgWidth ont tous le même taux de NULL, à 32,88 %
    • capMWAC atteint un maximum de 1128.931, capMWDC de 1467.61, et capMWDCest de 1758.501
    • effInit a un taux de NULL de 0,07 %, avec des valeurs allant de 0.09 à 0.21
    • instYr couvre 1985 à 2025, et instYrEst, avec un taux de NULL de 0,32 %, couvre 2003 à 2025
    • mount comporte 9 valeurs distinctes, modType en comporte 3, et Source 10
    • tilt et tiltEst ont tous deux un taux de NULL de 46,39 %
    • totArea va de 30 à 19 603 313, et totRowArea de 30 à 8 537 538

Installations solaires en toiture

  • Le jeu de données Rooftop arrays a été visualisé en heatmap sur la base du niveau H3 4
  • Le nombre d’enregistrements par source est dominé par OSM 2 175, CECSFC 1 835, TZSAM 1 024, USPVDB 485
    • S’y ajoutent GRW 93, GMSEUSdigArraysPanels_v2_0 54, gspt 46, SAM 43, GMSEUSgeoref_v2_0 24, CCVPV 16, GPPDB 15, CWSD 10, InSPIRE 2
  • La source dominante la plus fréquente a été calculée séparément pour chaque hexagone H3 de niveau 3, puis affichée sur la carte
  • Dans le tableau croisé mount / modType, modType est presque entièrement concentré sur c-si
    • fixed_axis apparaît comme c-si 381, thin-film 2
    • single_axis apparaît comme c-si 210, dual_axis comme c-si 33, et unknown comme c-si 98
    • Les lignes où mount est NULL sont les plus nombreuses, avec c-si 5096
  • Les statistiques de surface par année d’installation n’utilisent que les lignes disposant d’une valeur instYr, en agrégeant la période 2003–2025
    • En 2011, on obtient count 46, une surface moyenne de 41 511 et un maximum de 487 111
    • En 2017, count 105, moyenne 20 882, maximum 315 564
    • En 2018, count 225, soit le plus grand nombre annuel, avec une moyenne de 13 584 et un maximum de 152 636
    • En 2025, count 148, moyenne 12 363, maximum 135 270

Empreintes des installations en toiture

  • Sur la carte allant de Los Angeles à Long Beach, les résultats de détection sont affichés avec des couleurs par source
  • Certaines sources dessinent le contour des bâtiments de manière conservatrice
  • D’autres sources utilisent des limites de forme plus organique
  • La source gspt représente les détections comme des formes grossièrement circulaires
    • Dans l’image d’exemple, on voit 4 entrepôts avec des panneaux en toiture, mais la détection n’apparaît que sous la forme de 2 grands cercles
  • Dans l’ensemble de Los Angeles, de nombreuses installations en toiture restent non détectées
    • Ce jeu de données ne contient qu’environ 5K enregistrements, laissant une large marge pour étendre la couverture

Arrays et panneaux

  • Le jeu de données Arrays a lui aussi été visualisé en heatmap sur la base du niveau H3 4
  • Le nombre d’enregistrements par source est dominé par OSM 5 222, USPVDB 4 024, TZSAM 3 278, CECSFC 2 288
    • Puis viennent GMSEUSgeoref_v2_0 1 697, GMSEUSdigArraysPanels_v2_0 1 291, GRW 957, CCVPV 155, CWSD 68
  • La source dominante la plus fréquente a été calculée pour chaque hexagone H3 de niveau 3, puis affichée sur la carte
  • Même pour des centrales solaires très proches, les sources de détection peuvent être différentes
  • Le jeu de données Arrays ne capture pas toutes les centrales solaires, et certaines sources ne montrent que les limites des arrays sans afficher les panneaux eux-mêmes
    • Dans l’exemple -118.355, 34.837, les panneaux sont affichés en violet
  • Les statistiques de capacité des arrays par année d’installation agrègent ensemble les moyennes, médianes et maxima AC/DC
    • En 1985 : count 1, ACavg 14, DCavg 17
    • En 2014 : count 913, ACavg 6, DCavg 7, ACmax 586, DCmax 752
    • En 2020 : count 1673, ACavg 11, DCavg 15, ACmax 638, DCmax 829
    • En 2021 : count 1705, ACavg 19, DCavg 24, en hausse
    • En 2023 : count 2017, ACavg 34, DCavg 44, ACmax 1095, DCmax 1423
    • En 2024 : count 730, ACavg 37, DCavg 44
    • En 2025 : count 152, ACavg 18, DCavg 23, ACmax 1129, DCmax 1468

Visualisation des panneaux et éléments atypiques

  • Dans un parc solaire de Californie situé à -115.47, 35.57, le champ azimuth est visualisé sous forme de dégradé
  • Cette détection figure dans le jeu de données panels, mais dans les commentaires Hacker News il est indiqué que la structure n’est pas un panneau mais un miroir, relié à l’Ivanpah Solar Power Facility
  • La même forme de visualisation est montrée dans d’autres parcs
  • Dans les zones désertiques, de vastes motifs ressemblant à des microchips sont visibles

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.