6 points par GN⁺ 2025-04-19 | 6 commentaires | Partager sur WhatsApp
  • La traque de localisation à partir d’images avec ChatGPT est en train de devenir une tendance virale
  • Les derniers modèles d’OpenAI, o3 et o4-mini, combinent analyse d’images et recherche web pour effectuer des déductions de localisation avec une grande précision
  • Les utilisateurs soumettent à o3 des menus de restaurant, des scènes de rue ou des portraits, et tentent d’en déduire le lieu comme dans le jeu « GeoGuessr »
  • Les inquiétudes liées à l’atteinte à la vie privée grandissent, et OpenAI, malgré l’existence de garde-fous, manque de mesures de prévention claires
  • OpenAI a indiqué disposer de systèmes de détection des abus et de réponse, mais des critiques estiment que les restrictions concrètes restent insuffisantes

Tendance du retraçage à partir d’images avec ChatGPT

  • Une tendance consistant à retrouver le lieu visible dans une image via ChatGPT se propage récemment parmi les utilisateurs
  • Les nouveaux modèles o3 et o4-mini lancés par OpenAI peuvent raisonner à partir d’informations visuelles contenues dans une image
  • Même des photos floues ou déformées peuvent être analysées après prétraitement, comme le recadrage, la rotation ou le zoom
  • Combinée à la recherche web, cette capacité montre d’excellentes performances pour déduire l’emplacement de villes, monuments, restaurants, bars et autres lieux

ChatGPT utilisé comme GeoGuessr

  • Les utilisateurs demandent à o3 d’« agir comme GeoGuessr » et tentent d’estimer un lieu à partir de captures de stories Instagram, de photos de rue ou de menus

    • GeoGuessr est un jeu en ligne où l’on met en ligne une photo pour en retrouver le lieu
  • ChatGPT déduit un lieu à partir des seuls indices visuels, sans historique de conversation ni métadonnées EXIF

  • o3 a notamment montré, dans certaines situations, de meilleures performances que GPT-4o

    Exemple : à partir d’une photo d’une décoration de rhinocéros violet accrochée dans un bar sombre

    • GPT-4o a répondu à tort « pub britannique »
    • o3 a correctement déduit « un bar speakeasy à Williamsburg »

GPT-4o affiche lui aussi une précision surprenante

  • Lors d’un test mené par TechCrunch, GPT-4o a lui aussi montré une précision assez élevée, avec une vitesse de traitement supérieure
  • Cela dit, sur certaines images, seul o3 a réussi à identifier correctement le lieu
  • o3 n’est toutefois pas parfait, et il lui arrive de ne pas répondre ou de proposer un lieu sans rapport

Risques potentiels d’atteinte à la vie privée

  • Le fait que n’importe qui puisse, sans contrainte particulière, retrouver la localisation d’une autre personne à partir de ses photos constitue un problème majeur
  • Par exemple, la capture d’une story Instagram peut mener à un risque de doxxing
  • À l’heure actuelle, OpenAI ne mentionne pas ce problème dans le rapport de sécurité officiel concernant les modèles o3 et o4-mini

Position officielle d’OpenAI

  • Quelques heures après la publication de l’article, OpenAI a transmis à TechCrunch la déclaration suivante :

    « o3 et o4-mini ajoutent à ChatGPT des capacités de raisonnement visuel,
    qui peuvent être utiles pour l’accessibilité, la recherche et les situations d’urgence.
    Nous les avons entraînés à refuser les demandes d’informations sensibles,
    avons mis en place des mécanismes de prévention de l’identification des personnes et de surveillance des abus,
    et nous intervenons activement en cas de violation des politiques. »

  • Malgré cela, les mécanismes de blocage spécifiques ou les contrôles techniques visant la fonctionnalité de retraçage de localisation restent insuffisants

6 commentaires

 
ndrgrd 2025-04-19

En réalité, c’est simplement l’ordinateur qui prend en charge la partie fastidieuse ; la méthode en elle-même existait déjà, non ?

 
kandk 2025-04-21

L’IA, au fond, fait aussi ce que les humains peuvent faire. (comme un robot aspirateur)

 
unsure4000 2025-04-19

Le temps et le coût nécessaires ont été réduits de plusieurs dizaines de fois. Il est clair que cela représente une aggravation de la menace.

 
ndrgrd 2025-04-19

Comme indiqué dans le texte, c’était déjà quelque chose dont on profitait sous forme de « jeu », donc ce n’était pas non plus auparavant à un niveau difficilement accessible au grand public.
La menace apparaît lorsqu’on publie une photo permettant d’identifier facilement un lieu alors qu’il ne devrait pas être possible de le localiser.

Avant même cela, comme on le voit aussi dans les commentaires de Hacker News, publier quelque chose sur l’internet public implique déjà de partir du principe qu’il y aura exposition d’informations.

 
roxie 2025-04-20

Je suis globalement d’accord. Mais le fait que « n’importe qui » puisse le faire « en un instant » fait aussi penser à des effets secondaires plutôt inquiétants.

 
GN⁺ 2025-04-19
Avis Hacker News
  • Il y a l’inférence « véhicule avec conduite à gauche, mais circulation à gauche », mais la photo ne donne aucun indice sur le sens de circulation
  • En réponse à l’avis selon lequel « la langue sur l’enseigne du magasin ressemble davantage à un nom commercial en alphabet latin qu’à de l’espagnol ou du portugais », l’espagnol et le portugais s’écrivent eux aussi avec l’alphabet latin
  • En prenant une photo de rue et en retirant certains points de repère, il y avait une erreur d’environ 500 km, mais beaucoup d’éléments ont été correctement déduits
    • En utilisant la photo entière, il a mal identifié une île célèbre
    • En utilisant aussi une photo du point de repère via Google Images, il l’a identifiée comme la même île
  • Je suis convaincu que c’est une technologie qui va au-delà de ChatGPT
    • Quand une photo créée avec ChatGPT a été envoyée à la fonction « Describe » de Midjourney, elle a généré une description incluant l’emplacement exact
    • La disposition des montagnes en arrière-plan semble indiquer une région précise
  • Je ressens un rejet chaque fois qu’une nouvelle tendance apparaît
    • Quand on lui a montré une photo de rue à Rome, elle a été supprimée pour violation des règles
  • En demandant comment régler l’horloge de l’autoradio, il a identifié la méthode exacte ainsi que le modèle de radio
  • Des inquiétudes sur un « nouveau risque pour la vie privée »
    • Internet lui-même comporte des risques pour la vie privée
    • Souligner un nouveau risque à chaque fois est excessif
  • Les techniques d’inférence de localisation vont progresser dans le jeu Geoguessr
    • Des technologies capables d’identifier précisément un lieu à partir d’images satellite ou non satellite seront développées
  • Un score de 22k/25k a été obtenu dans Geoguessr avec Gemini 2.5
    • C’était exact pour Essen en Allemagne et Sheffield au Royaume-Uni, mais il y avait des écarts pour l’Italie et la Russie
    • Le résultat a été déduit à partir d’une seule image
  • Une photo prise sur le fleuve Han à Da Nang, au Vietnam, a été analysée et l’emplacement a été trouvé avec précision
    • Cela confirme l’existence de techniques d’analyse
  • La ville a été correctement identifiée à partir d’une photo de rue, mais la rue précise ou le quartier ont été mal déduits
    • La recherche d’image inversée de Google fournit des résultats plus précis