Présentation de en.osm.town
- en.osm.town fait partie d’un réseau social décentralisé basé sur Mastodon
- Il s’agit d’une communauté indépendante de la communauté OpenStreetMap, financée par l’OpenStreetMap Foundation
- Statistiques du serveur : 257 utilisateurs actifs
Points clés
- Grant Slater propose aux entreprises d’IA de faire un don de 10 000 $ au lieu de scraper discrètement les données d’OpenStreetMap
- Un don de 50 000 $ permettrait aussi de fournir des mises à jour en streaming en temps réel
- Bart Louwers mentionne que le scraping d’OpenStreetMap est courant
- wikiyu affirme qu’utiliser les données planet.osm est plus efficace
- Josua critique la manière inefficace dont l’IA est entraînée
- Juan Luis indique qu’un problème similaire d’abus par des crawlers d’IA se produit aussi sur Read the Docs
- Simon Poole soutient qu’une approche raisonnable pourrait nuire à l’image des entreprises d’IA
- Michał avance que des prestataires d’un pays donné ont peut-être reçu pour mission de télécharger les données OSM
- leadingzero critique le fait que les exigences de licence d’OSM ne soient pas correctement appliquées
- Grant Slater mentionne avoir créé un dépôt GitHub pour suivre les propriétés des tuiles
- Guillaume Rischard mentionne avoir récemment réglé une question juridique en Allemagne
- Adderall girl grindset (Jes) propose de bloquer les crawlers d’IA
Résumé de GN⁺
- Cet article traite du problème des entreprises d’IA qui scrapent les données d’OpenStreetMap
- Il propose des moyens d’utiliser efficacement les données d’OpenStreetMap ainsi qu’une approche d’accès aux données via des dons
- Il discute du problème des abus des crawlers d’IA et des réponses possibles
- Parmi les projets aux fonctionnalités similaires figurent Google Maps et Bing Maps
1 commentaires
Avis sur Hacker News
robots.txt, n’utilisent pas les API publiques et ne respectent pas les pics de charge, ce qui augmente les coûts d’infrastructuredocker runplanet.osmsur torrent et n’autoriser le scraping que via torrent pourrait répartir la charge réseau