3 points par GN⁺ 2025-03-24 | 2 commentaires | Partager sur WhatsApp
  • Mozilla.ai estime que l’intelligence artificielle (IA) offre de nombreuses opportunités pour renforcer les communautés grâce à la collaboration ouverte.
  • Ces opportunités doivent être conçues avec soin, tandis que les inquiétudes liées à une utilisation excessive de l’IA augmentent.
  • C’est dans ce contexte qu’a été développé et lancé l’OpenStreetMap AI Helper Blueprint.
  • Pourquoi OpenStreetMap ?
    • Les données sont un composant essentiel des applications d’IA, et OpenStreetMap s’appuie sur une communauté active qui maintient la base de données cartographique ouverte la plus complète.
    • OpenStreetMap fournit des données variées, comme les routes ou les gares ferroviaires, et, combiné à des images satellite, offre des possibilités quasi infinies pour entraîner différents modèles d’IA.
    • L’objectif est d’accélérer les parties lentes du processus de cartographie grâce à l’IA, tout en conservant une validation humaine sur les étapes importantes.
  • Pourquoi la vision par ordinateur ?
    • De nombreuses entités cartographiques sont représentées sous forme de polygones, et leur repérage comme leur tracé prennent beaucoup de temps.
    • Les modèles de vision par ordinateur peuvent accomplir facilement ces tâches lorsqu’ils disposent de suffisamment de données.
    • Les modèles YOLOv11 et SAM2 sont utilisés pour la détection d’objets et la segmentation ; ils sont légers, rapides et adaptés à une utilisation en local.
  • OpenStreetMap AI Helper Blueprint
    • Étape 1 : créer un jeu de données de détection d’objets à partir d’OpenStreetMap
      • Combiner les données OpenStreetMap avec des images satellite et les convertir dans un format adapté à l’entraînement.
      • Télécharger les données des zones d’intérêt à l’aide des API Nominatim et Overpass, puis les enregistrer au format Ultralytics YOLO.
    • Étape 2 : affiner le modèle de détection d’objets
      • Affiner le modèle YOLOv11, puis le téléverser sur Hugging Face Hub.
    • Étape 3 : contribuer à OpenStreetMap
      • Utiliser le modèle affiné pour exécuter l’inférence sur plusieurs tuiles, puis téléverser vers OpenStreetMap les nouveaux objets après validation manuelle.
  • Réflexions finales
    • OpenStreetMap est un exemple puissant de collaboration ouverte pour créer une carte mondiale pilotée par la communauté.
    • OpenStreetMap AI Helper Blueprint montre comment l’IA peut renforcer les contributions humaines et souligne la valeur de données de haute qualité.
    • Avec ce Blueprint, il est possible de cartographier environ 5 fois plus de piscines qu’avec un travail manuel sur la même durée.
    • Il est recommandé d’expérimenter l’entraînement de modèles pour d’autres entités cartographiques, ainsi que de contribuer au projet ou de l’étendre.

2 commentaires

 
depth221 2025-03-24

Après vérification, il semble que Map Feature se traduise généralement par « objet cartographique ».

 
GN⁺ 2025-03-24
Commentaires sur Hacker News
  • Bonjour de la part de l’OpenStreetMap Foundation. Les éléments détectés par l’IA ne doivent pas être ajoutés directement à la base de données

    • Les algorithmes ont des problèmes de faux positifs et ont tendance à cartographier de façon tremblante les objets rectilignes ou rectangulaires
    • C’est utile comme outil pour détecter des éléments manquants, mais une intervention humaine est nécessaire pour vérifier que les objets détectés ont été correctement dessinés
    • Les directives correspondantes sont disponibles sur le wiki OpenStreetMap
  • Après la détection des piscines, j’aimerais essayer aussi la détection des panneaux solaires

    • Beaucoup s’opposent à l’idée qu’OSM puisse se développer uniquement de façon manuelle
    • J’ai effectué 60 000 modifications en 10 ans, mais la passion des bénévoles humains ne suffit pas à résoudre la cartographie à l’échelle mondiale
    • Il faut un framework extensible permettant d’annoter la qualité des données, leur provenance, la manière de signaler les bugs et les consignes pour les consommateurs
    • Par exemple, si je veux interroger les « entreprises de type X cartographiées par des humains au cours de la dernière année », c’est partiellement possible avec la « date de vérification »
    • Mais on ne peut pas savoir si les attributs sont exacts ni si le cartographe a seulement vérifié le nom et l’emplacement
    • Il vaudrait peut-être mieux collecter les horaires d’ouverture de tous les lieux afin de maintenir automatiquement les données chaque mois
    • En tant que consommateur de données, il serait peut-être préférable de pouvoir filtrer uniquement des sources spécifiques dignes de confiance
    • On peut utiliser les données même avec des restrictions comme les POI inférés par l’IA
  • Après avoir fait moi-même l’expérience de la cartographie automatisée, je suis devenu très méfiant

    • J’ai voyagé à moto en Amérique du Sud, et OSM contenait beaucoup de modifications qui semblaient automatisées, au point d’être presque inutilisable dans certaines zones
    • Cela se produit non seulement sur les routes rurales, mais aussi dans des villes assez grandes
  • J’ai travaillé dans ce domaine il y a quelques années

    • Il existe déjà beaucoup de modèles, de jeux de données, d’outils, etc.
    • Les ressources associées sont disponibles sur GitHub
  • Nous ne cartographions pas ce qui est visible sur les images satellite, mais des informations réelles au sol

    • Il ne faut pas contribuer avec ce que l’IA a imaginé
  • Google ne l’autorise pas, mais Mapbox l’autorise pour un usage non commercial ou pour OSM

    • Il est possible de générer des jeux de données vectorielles dérivés à partir des images satellite de Mapbox
  • J’aimerais que Mozilla se concentre sur la création d’un bon navigateur

  • J’ai fait un travail similaire il y a quelques mois (données géographiques à petite échelle)

    • Les ressources associées sont disponibles sur GitHub
  • J’aimerais voir des détails sur la manière de faire un fine-tuning de SAM/2 pour détecter des piscines ou des installations solaires

    • Ce serait utile pour des projets de résilience communautaire, mais je n’ai pas réussi à suivre le fine-tuning de SAM2
    • Le modèle Yolov8 repère et segmente bien le solaire, mais les contours sont très mauvais, ce qui demande beaucoup de travail
    • Les résultats entraînés avec SAM2 semblent bien meilleurs
    • Je ne les ajouterais pas à OSM à cause des problèmes de précision, mais ils peuvent être utilisés ailleurs
  • On appelait cela du « head-up digitizing »