5 points par GN⁺ 2025-12-16 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Un projet qui a scrapé les données de tous les restaurants de Londres et construit un modèle de machine learning pour analyser l’impact structurel de l’algorithme de Google Maps sur la survie des petits commerces urbains
  • Le classement de Google Maps n’est pas une simple liste : il joue un rôle de « market maker » en organisant activement la demande à travers les signaux de pertinence, distance et prominence (notoriété)
  • Le projet montre une structure qui se renforce de façon cumulative via le volume et la vitesse des avis, la notoriété de marque et les mentions sur le web, créant une boucle exposition initiale → hausse de la demande → hausse des avis → exposition supplémentaire
  • Cette structure avantage les chaînes et les restaurants situés dans les zones centrales, tandis que les nouveaux restaurants indépendants font face à un « problème de cold start » qui les rend difficiles à découvrir faute d’avis
  • Pour distinguer ces effets, un modèle de ML a été construit pour prédire une note attendue (contrefactuelle) à partir des seules conditions structurelles d’un restaurant, puis calculer l’écart avec la note réelle comme résidu (residual) afin d’identifier les restaurants surévalués ou sous-évalués par l’algorithme
  • Le projet va plus loin en agrégeant les restaurants à l’échelle locale pour analyser, via ACP et clustering, la force structurelle des hubs de restauration, et montrer comment la plateforme reconfigure l’écosystème alimentaire urbain

Google Maps n’est pas un répertoire, mais un market maker

  • Contrairement au récit officiel selon lequel Google Maps refléterait passivement « ce que les gens aiment », il organise en pratique la demande à travers trois signaux clés : relevance (pertinence), distance et prominence (notoriété)
  • La relevance est déduite de la correspondance textuelle entre la requête de recherche et les métadonnées de l’entreprise ; la distance est un facteur purement spatial
  • La prominence est calculée à partir du nombre d’avis, de leur rythme d’arrivée, de la note moyenne, de la notoriété de marque, de la visibilité sur le web, etc., et c’est là que commence son impact politico-économique
    • Elle reflète à quelle fréquence les gens interagissent avec un lieu, le mentionnent et le connaissent déjà
  • En d’autres termes, Google Maps ne se contente pas de « refléter » la demande : c’est un market maker qui l’organise via son algorithme de classement

Structure d’avantage cumulatif et effet Matthieu

  • La visibilité dans la liste de classement détermine la fréquentation, la fréquentation détermine la vitesse d’accumulation des avis, et ces avis réalimentent ensuite le signal de prominence : c’est un mécanisme d’avantage cumulatif (cumulative advantage)
  • Le phénomène ressemble à la croissance composée du capital sur les marchés financiers ; c’est une application de l’effet Matthieu (Matthew Effect) à l’échelle du kebab du coin
    • Le principe du « on donnera encore à celui qui a déjà »
  • Les chaînes sont avantagées grâce à leur notoriété multi-sites, et les établissements situés dans des zones à fort passage accumulent plus vite des avis à qualité égale, ce qui les fait remonter dans la prominence
  • Les nouveaux établissements indépendants affrontent un problème de cold start : sans avis, ils sont difficiles à découvrir, et sans découverte, il est difficile d’accumuler des avis
  • Ce qui semble relever d’un choix consommateur neutre doit en réalité être compris comme un design de marché médié par l’algorithme

La plateforme comme market maker

  • En économie, un market maker n’est pas un simple miroir de l’offre et de la demande : c’est un intermédiaire qui façonne activement la liquidité, l’appariement et la découverte des prix
  • Les plateformes comme Google Maps jouent un rôle similaire pour les services locaux, non pas en contrôlant le prix, mais en contrôlant la visibilité
  • Dans le vocabulaire de l’économie numérique, l’algorithme de classement agit comme un attention allocator, dirigeant la demande vers certains établissements et l’éloignant d’autres

Une ville contrefactuelle construite par machine learning

  • Si Google Maps est le market maker de la demande urbaine, la question centrale devient : à quoi ressemblerait la ville sans cette couche d’amplification ?
  • Un modèle de machine learning a été construit pour séparer la performance intrinsèque des restaurants de l’effet de visibilité de la plateforme
  • Utilisation de HistGradientBoostingRegressor (l’arbre de décision boosté par gradient de scikit-learn)
    • Adapté à de grands tableaux de données mixtes et désordonnés, avec capacité à capter les effets d’interaction sans spécification manuelle
  • Variables du modèle :
    • Nombre d’avis (transformé en log pour refléter les rendements décroissants de l’attention)
    • Type de cuisine, statut chaîne/indépendant, gamme de prix, catégorie d’activité (restaurant/café/takeaway/bar)
    • Position dans la ville via une grille spatiale

Un modèle séparé pour classifier les types de cuisine

  • Le projet a constaté que la classification des cuisines dans Google Maps était imprécise et incohérente
    • Une grande partie des établissements sont étiquetés de manière vague comme "restaurant", "cafe", "meal takeaway", etc.
  • Un modèle de classification distinct a été construit pour prédire le type de cuisine à partir du nom du restaurant, de la langue des menus et du texte des avis
  • Le filtre de type de cuisine dans le dashboard repose donc sur les résultats du machine learning, et non sur les tags Google
  • Une mauvaise classification des cuisines fausse les analyses de diversité, de clustering et de concurrence géographique

Mesurer la sous-évaluation algorithmique avec le rating residual

  • Toutes les variables passent par un pipeline standard de prétraitement (imputation des valeurs manquantes, encodage, etc.)
  • Le modèle apprend uniquement la correspondance entre les caractéristiques observables sur la plateforme et la note
  • Pour chaque restaurant, il produit une note attendue contrefactuelle (counterfactual expected rating)
  • L’écart entre la note réelle et la note prédite constitue le rating residual
    • Résidu positif : performance réellement supérieure à la ligne de base de la plateforme
    • Résidu négatif : performance inférieure à ce que l’algorithme tend habituellement à récompenser
  • Ce n’est pas une mesure parfaite de la qualité culinaire, mais c’est un indicateur puissant de mauvaise tarification algorithmique (algorithmic mispricing)
    • Il permet de repérer les endroits où la valeur sociale ou culinaire diverge de ce que la plateforme amplifie structurellement

Les limites de la visibilité publicitaire payante

  • Certains restaurants paient pour des promoted pins ou des annonces de recherche locale
  • Cette visibilité payante n’étant pas publique, elle ne peut pas être estimée
    • C’est un signe du degré d’opacité qu’a pris le pouvoir des plateformes
  • Le rating residual peut donc refléter en partie des dépenses publicitaires non observables

Présentation du London Food Dashboard

  • Création du London food dashboard pour résumer les résultats de l’analyse
  • Fonctions actuelles : recherche par nom, filtre des bonnes adresses sous-évaluées (identifiées par l’algorithme de machine learning), filtres par type de cuisine, borough, gamme de prix, note minimale et nombre d’avis
  • Encore en bêta, il sert déjà de microscope sur l’économie alimentaire algorithmique de Londres
  • Adresse : laurenleek.eu/food-map
  • Le filtre "underrated gems" illustre l’usage des résidus du modèle
    • Les bulles plus grandes et plus sombres indiquent des lieux sous-évalués par l’algorithme

Du restaurant individuel au voisinage algorithmique

  • Les restaurants n’échouent pas seuls ; ils échouent au sein d’un écosystème
  • Une deuxième couche de modélisation a été ajoutée pour analyser ce qui se produit lorsque les dynamiques de plateforme s’étendent du restaurant individuel à l’ensemble de l’écosystème alimentaire d’un quartier
  • Les restaurants sont agrégés dans de petites cellules spatiales (des hexagones sur la carte, plus adaptés que les carrés pour limiter les edge effects)
  • Des caractéristiques synthétiques sont calculées pour chaque zone : densité de restaurants, note moyenne, résidu moyen, nombre total d’avis, part de chaînes, cuisine entropy, gamme de prix
  • Les variables sont standardisées puis une ACP (analyse en composantes principales) est appliquée pour compresser la force globale de l’« écosystème de restauration » en un hub score continu
  • Un clustering K-means est ensuite appliqué dans ce même espace de caractéristiques pour classer les zones en quatre types structurels :
    • Hubs elite, strong, everyday, weak

Résultats de l’analyse des hubs

  • Les motifs semblent familiers : le centre de Londres domine
  • Mais l’essentiel n’est pas l’emplacement des hubs, c’est leur type
  • Le projet identifie les 5 hubs de restauration les plus structurellement puissants de Londres à partir du hub score global, et non des notes brutes
    • Ce sont les lieux où s’alignent densité, attention algorithmique, survie des indépendants et pouvoir d’achat des consommateurs
    • Ils sont indiqués sur la carte
  • Afin d’éviter d’alimenter des conflits de voisinage, le texte ne liste pas explicitement ce classement

Densité des cuisines et diversité culinaire à Londres

  • Superposer le panneau de densité par type de cuisine à l’analyse des hubs fait apparaître le tableau avec encore plus de netteté
  • La diversité culinaire de Londres n’est pas répartie uniformément dans l’économie de plateforme
  • Les cuisines immigrées se concentrent fortement dans des zones de la ville où la visibilité algorithmique est structurellement plus faible
  • Les cuisines Italian, Indian, Turkish, Chinese, Thai, British, Japanese, French, American, fish-and-chips reflètent chacune une histoire d’implantation, des réseaux de travail, des formats de commerce et des rapports spécifiques au capital et aux loyers
  • Certaines cuisines forment de longs corridors continus, tandis que d’autres apparaissent sous forme de clusters discontinus liés à des rues commerçantes précises ou à certaines catégories de revenus
  • La diversité culinaire n’est pas une simple affaire de goût : elle dépend des lieux d’installation des familles, des rues commerçantes restées assez abordables assez longtemps pour qu’une deuxième génération y ouvre un commerce, et des zones de la ville où la migration a précédé la maturation d’un écosystème culinaire

Implications pour les politiques publiques

  • Ce projet est parti d’un problème de recherche, avant de déboucher sur une question bien plus large
  • Le résultat le plus important n’est pas de savoir quel quartier arrive en tête, mais de reconnaître que les plateformes structurent désormais silencieusement la survie sur les marchés urbains du quotidien
  • La scène culinaire londonienne n’est plus organisée uniquement par le goût
    • Elle l’est par une visibilité à rendement composé, par des loyers qui montent une fois la découvrabilité installée, et par des algorithmes qui distribuent l’attention bien avant l’arrivée effective des consommateurs
  • Ce qui ressemble à du « choix » devient de plus en plus un effet en aval des systèmes de classement

Nécessité de transparence et d’audit des algorithmes

  • Si la découvrabilité façonne désormais la survie des petits commerces, alors concurrence, équité et régénération urbaine ne peuvent plus ignorer les systèmes de classement des plateformes
  • Même si les collectivités réaménagent les rues et assouplissent les licences, une invisibilité algorithmique peut isoler économiquement certains lieux
  • La transparence des plateformes et leur auditabilité ne relèvent plus d’un débat technique de niche : elles deviennent silencieusement un outil de politique économique locale
  • À minima, un algorithme de classement produisant de tels effets économiques doit être auditable
    • De la même manière qu’on audite les marchés financiers, il faut aussi auditer le marché de l’attention (attention market)
  • Il faut mesurer l’ampleur du pouvoir que Google Maps exerce en tant qu’application de navigation

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.