2 points par GN⁺ 2025-12-22 | 1 commentaires | Partager sur WhatsApp
  • Claude in Chrome est une extension IA capable de cliquer sur des boutons, remplir des formulaires et naviguer entre les pages dans le navigateur
  • Elle s’intègre à Claude Code et Claude Desktop dans le navigateur pour automatiser les tâches de développement et de travail
  • Elle automatise les tâches répétitives sur divers services web comme Google Drive, le calendrier, les CRM, l’e-mail et les tableaux de bord analytiques
  • Fonction réservée aux abonnés payants, actuellement en version bêta
  • L’accent est mis sur la nécessité de reconnaître les risques de sécurité, notamment les attaques par prompt injection, et de laisser l’utilisateur examiner et approuver lui-même les autorisations et les actions

Présentation de Claude in Chrome

  • Claude fonctionne désormais directement dans le navigateur, où il peut cliquer sur des boutons, saisir des formulaires et naviguer entre les pages
    • Il s’intègre à Claude Code et Claude Desktop pour prendre en charge les workflows de développement et de test
    • Il est actuellement proposé en version bêta à tous les abonnés payants
  • L’installation est possible via le Chrome Web Store, avec une vidéo de démonstration et un guide d’utilisation

Fonctionnalités principales

  • Prise en charge de l’automatisation dans le navigateur
    • Claude peut cliquer sur des boutons, remplir des formulaires et passer d’une page à l’autre dans Chrome
    • L’utilisateur peut piloter des apps et des workflows via Claude sans quitter le navigateur
  • Exécution de tâches en arrière-plan et planifiées
    • Claude peut terminer des tâches en arrière-plan pendant que l’utilisateur s’occupe d’autre chose
    • Prise en charge de l’exécution automatique quotidienne ou hebdomadaire pour des tâches comme la génération de rapports ou la mise à jour du planning
  • Intégration avec Claude Code
    • Les développeurs peuvent tester du code et effectuer des tâches répétitives directement dans Chrome

Cas d’usage

  • Extraction de données depuis un tableau de bord analytique : Claude parcourt la page d’analyse et résume les chiffres nécessaires
  • Organisation de Google Drive : création d’une arborescence de dossiers, déplacement de fichiers, repérage des doublons, etc.
  • Préparation d’agenda à partir du calendrier : lecture du contexte d’une réunion dans les fils d’e-mails et signalement des réunions nécessitant une préparation
  • Automatisation de la comparaison de produits : lecture des spécifications produit sur plusieurs sites et création d’un tableau comparatif dans Google Sheets
  • Rédaction de logs CRM : rapprochement des participants du calendrier avec Salesforce pour rédiger un brouillon de journal d’activité
  • Tri des e-mails promotionnels : identification des e-mails marketing et newsletters, puis suppression en lot après vérification

Sécurité et bonnes pratiques

  • Comme l’IA agit directement dans le navigateur, il existe des risques de sécurité liés à des acteurs malveillants
    • Des attaques par prompt injection peuvent notamment provoquer des actions non intentionnelles
    • Il est également mentionné que Claude peut halluciner et effectuer des actions différentes de l’intention de l’utilisateur
  • Consignes d’utilisation sûre
    • N’accorder des autorisations qu’à des sites de confiance
    • Éviter les tâches liées aux finances ou aux données personnelles, et toujours vérifier avant une action importante
    • Si Claude adopte un comportement inattendu, interrompre immédiatement l’exécution et examiner la situation
    • En cas de problème, le signaler via la fonction de feedback

Principaux points de la FAQ

  • Intégration de l’extension Chrome avec Claude Code : les développeurs peuvent utiliser Claude Code pour construire et tester directement dans Chrome. Cela peut accélérer les tâches répétitives sur les projets basés sur le navigateur
  • Intégration avec Claude Desktop : il est possible de poursuivre dans le navigateur un travail commencé dans l’app desktop
  • Activités déconseillées : transactions financières, gestion des mots de passe, traitement de données personnelles sensibles, etc. sont interdits
  • Contrôle des autorisations : avant utilisation, l’accès de Claude doit être approuvé à l’avance, et une nouvelle confirmation est demandée avant les actions irréversibles, comme un achat
  • Risques de sécurité : un attaquant peut tromper Claude pour l’inciter à divulguer des informations bancaires ou à supprimer des fichiers. Des protections existent, mais elles ne sont pas infaillibles

Participation des utilisateurs et améliorations

  • Les retours des utilisateurs contribuent directement à l’amélioration des fonctionnalités de Claude
  • L’extension Chrome respecte les règles des API Google et les exigences de limitation d’usage des données utilisateur

1 commentaires

 
GN⁺ 2025-12-22
Réactions sur Hacker News
  • Pendant des années, on a colmaté les failles de sécurité de V8, isolé le navigateur par processus et amélioré le sandboxing, et maintenant on propose de brancher un LLM avec le débogage activé dans Chrome — l’ironie est totale
    La dernière fois qu’on a eu ce genre de « bonne idée », ça a donné l’essence au plomb

    • Au final, l’objectif semble être d’intégrer directement l’IA dans Chrome
      Dans 20 ans, Gemini sera probablement bundlé de façon tellement pratique qu’il y aura un procès antitrust
      Documentation liée : Chrome Built-in AI APIs
    • Cette idée rappelle l’époque où on faisait des bêta-tests de “Full Autopilot” sur des humains
      Blague à part, je respecte le fait que le CEO d’Anthropic reste fidèle à une approche fondée sur des principes. Le fait d’avoir créé un agent de code basé sur le terminal est particulièrement impressionnant
    • Ça fait penser au mème « le cycle ne s’arrête jamais » de xkcd 2044
    • Est-ce que ça veut dire que des outils comme Claude Code tournent directement sur un compte personnel ou pro sans VM isolée ?
      Ce n’est pas une blague, ça me choque sincèrement
    • La vitesse d’innovation à court terme peut l’emporter sur les inquiétudes de sécurité à long terme
      Pour l’instant, c’est encore au niveau alpha, donc il y a des avertissements, et le modèle de sécurité ne sera sans doute finalisé que plus tard
  • Claude semble disposer d’un accès à des outils lui permettant d’exécuter du JS sur des pages web via le débogueur de Chrome
    Mais ne vous inquiétez pas, il y aurait un filtre par regex pour empêcher les fuites de secrets
    const r = [/password/i, /token/i, /secret/i, ...]

    • Si on lui demande « aide-moi à éviter d’exposer des mots de passe ou des tokens », il répondra sans doute « bien sûr ! voici une regex »
    • Il pouvait déjà générer des commandes curl, est-ce vraiment plus dangereux ?
    • « comprehensive », franchement, ça fait rire
  • Les inquiétudes de sécurité sont légitimes, mais en pratique le Rubicon a déjà été franchi avec des outils comme Claude Code ou Playwright MCP
    J’utilise Claude Code depuis plusieurs mois avec un accès complet au système
    Il peut lire des fichiers, exécuter bash, faire des git push. L’automatisation du navigateur est presque moins risquée
    La vraie question n’est pas « faut-il donner des accès à l’IA ? », mais « faut-il la concevoir pour qu’un humain valide directement les décisions importantes ? »
    De mon côté, je garde l’approbation manuelle pour les identifiants et les paiements, et je l’utilise pour les tests QA ou les saisies de formulaires répétitives

    • Moi aussi, depuis 2003, j’exécute tous mes outils de développement isolés dans des VM
    • Personnellement, l’approche container-first me semble plus sûre
      Il faudrait brancher le LLM sur une fenêtre QubesOS, de façon à ce que son comportement non déterministe n’affecte qu’une zone limitée
      Sans système solide de sauvegarde, rollback et restauration, c’est risqué
      L’idéal serait quelque chose comme des snapshots ZFS poussés vers rsync.net, mais je me demande s’il existe encore des solutions simples comme Time Machine
    • On dit « on a déjà franchi le Rubicon », mais ce “on” n’inclut pas tout le monde
      Beaucoup n’utilisent encore aucun outil d’IA, et si c’est intégré par défaut dans Chrome, il deviendra difficile d’y échapper
    • Je suis curieux : tu l’utilises surtout pour quels usages ?
  • Hier, j’ai demandé à Claude d’analyser une liste de 70 favoris Zillow, et il n’a pas su produire correctement un résumé des baisses de prix
    Il a fait comme s’il avait tout parcouru, mais en réalité non
    On dirait un compromis pour économiser des tokens : il fait une analyse à partir de captures d’écran au lieu de lire directement le DOM
    Même moi qui étais sceptique vis-à-vis de l’IA, j’y vois du potentiel, mais là c’est très en retard par rapport aux autres produits d’Anthropic

    • Ça marche mieux si tu précises directement le nom de l’outil dans le prompt, du style « récupère-le avec WebFetch »
    • La stratégie consistant à lui donner des captures d’écran est inefficace
      Il aurait été bien plus efficace de traiter le HTML comme du XML et de n’extraire que les données nécessaires avec des requêtes XPath
    • Ce serait intéressant d’essayer via l’API existante de contrôle à distance du navigateur avec Playwright MCP
    • Si c’est « à des années-lumière de retard », alors au rythme de l’IA, dans 3 mois il aura peut-être rattrapé son retard
    • Les LLM ont une compréhension faible de la notion du temps, donc ils gèrent mal les tâches qui demandent de la synchronisation
      C’est pour ça qu’une UX en texte/CLI est meilleure, avec idéalement un modèle std in/out
  • Claude Code n’arrivait pas à trouver une tâche via la CLI ou l’API publique, alors il a ouvert l’app grâce à la fonction d’intégration Chrome
    Il a extrait un token d’accès depuis les cookies puis a accédé directement à l’API privée
    Quelle époque incroyable

    • Il y a un risque de sécurité, mais sa capacité à résoudre le problème est impressionnante
      Il n’a ni halluciné ni abandonné, il a utilisé de façon créative les outils à sa disposition
    • C’est vraiment un résultat remarquable
  • On parle beaucoup de sécurité, mais on utilise quand même les permissions Debugger, ce qui ralentit la machine, expose à des vulnérabilités et crée des problèmes de CAPTCHA
    Je développe un concurrent, rtrvr.ai, et j’ai conçu une architecture qui évite les permissions sensibles
    Si Claude doit aussi être lancé pour le grand public, il lui faut une approche de ce type

    • Je lui ai confié une tâche qui ne nécessitait pas d’accès aux tableurs, et pourtant il continuait à demander l’accès à Google Drive
    • Ça sent un peu la pub, mais le nom d’entreprise façon 2004 sans voyelles est amusant
  • Google propose déjà cette fonctionnalité dans une offre expérimentale réservée aux abonnés à 125 $/mois
    Voir Google Labs Mariner
    L’automatisation du navigateur est aussi possible avec Gemini CLI, mais c’est moins interactif et l’accès au profil principal y est plus limité

    • On peut faire quelque chose de similaire gratuitement
      Il suffit de créer un workspace vide et de lui dire « fais X dans le navigateur », puis Chrome s’ouvre et effectue des clics, des scrolls, etc.
    • J’utilise très bien Chrome DevTools MCP pour le développement web et les tests
      Claude Code peut agir comme un utilisateur et même lire la sortie de la console
      Ce n’est pas fait pour interagir avec des sites tiers, mais pour le développement c’est excellent
  • Mettre Claude directement dans le navigateur est pratique, mais les extensions se situent à une couche extrêmement sensible
    Une fois que l’IA tourne sous forme d’extension, la question la plus importante n’est plus « est-ce utile ? » mais « à quelles données a-t-elle accès ? »
    Il faut clarifier quels contenus de pages elle peut lire, comment les prompts et réponses sont traités, et si ces données sont conservées après la session
    Dans un navigateur, la transparence et le principe du moindre privilège sont essentiels

  • En pratique, c’est un concept qui remplace Chrome DevTools MCP, mais les avis du Chrome Web Store ne sont pas bons

  • On n’accorderait même pas ce niveau d’accès au navigateur à un humain, alors pourquoi vouloir le donner à une IA ?

    • Peut-être qu’on anthropomorphise les LLM comme s’ils étaient humains, alors qu’en réalité ce sont peut-être surtout des calculatrices très sophistiquées
      C’est très éloigné de la conscience humaine, mais on peut y voir l’étape suivante de la calculatrice
      C’est pourquoi on pourrait leur autoriser des accès qu’on jugerait dangereux pour des humains
      Un peu comme le concept de Golem, une entité qu’on imagine depuis longtemps sans jamais avoir su la créer pour de vrai
      Voir l’article Wikipédia sur le Golem