3 points par GN⁺ 2026-03-16 | 1 commentaires | Partager sur WhatsApp
  • Le serveur Chrome DevTools MCP a été amélioré pour permettre aux agents de code de se connecter directement à une session de navigateur active
  • Grâce à cette fonctionnalité, les agents peuvent réutiliser une session déjà connectée ou accéder à la session de débogage active de DevTools
  • Dans Chrome M144 (bêta), l’option --autoConnect permet au serveur MCP de se connecter automatiquement à une instance Chrome en cours d’exécution
  • À chaque connexion, une boîte de dialogue d’approbation utilisateur s’affiche, et pendant le débogage, une bannière « automated test software » indique que le navigateur est contrôlé
  • Il devient possible de basculer librement entre débogage manuel et débogage assisté par IA, ce qui améliore l’efficacité du développement

Aperçu des améliorations du serveur Chrome DevTools MCP

  • Le serveur Chrome DevTools MCP a été mis à jour pour permettre aux agents de code de se connecter directement à une session de navigateur active
    • Les utilisateurs peuvent réutiliser une session déjà connectée et déboguer sans devoir se reconnecter
    • Il est possible de demander à l’agent d’examiner un élément sélectionné dans le panneau Network ou le panneau Elements de l’interface DevTools
  • Les méthodes de connexion existantes restent disponibles, avec utilisation d’un profil dédié au serveur MCP, connexion à un port de débogage distant et exécution de plusieurs instances basées sur des profils temporaires

Fonctionnement (How it works)

  • Chrome M144 (actuellement en bêta) ajoute une fonction de demande de connexion de débogage à distance
    • Lorsque le serveur MCP est lancé avec l’option --autoConnect, il se connecte automatiquement à l’instance Chrome active et demande une session de débogage à distance
  • Pour renforcer la sécurité, Chrome affiche une boîte de dialogue d’approbation utilisateur à chaque demande, et n’autorise la connexion qu’après validation
  • Une fois la session de débogage activée, une bannière « Chrome is being controlled by automated test software » s’affiche en haut du navigateur

Prise en main (Get started)

  • Pour utiliser la nouvelle fonctionnalité de débogage à distance, il faut activer le débogage à distance dans Chrome et configurer le serveur MCP

Étape 1 : configurer le débogage à distance dans Chrome

  • Aller sur chrome://inspect/#remote-debugging pour activer le débogage à distance
  • Choisir via la boîte de dialogue s’il faut autoriser ou non la connexion de débogage

Étape 2 : configurer la connexion automatique du serveur MCP

  • Lors du lancement du serveur chrome-devtools-mcp, ajouter l’argument --autoConnect
  • Exemple de configuration (gemini-cli) :
    {
       "mcpServers": {
        "chrome-devtools": {
          "command": "npx",
          "args": [
            "chrome-devtools-mcp@latest",
            "--autoConnect",
            "--channel=beta"
          ]
        }
      }
    }
    
    • Tant que Chrome M144 n’a pas atteint le canal stable, il faut préciser --channel=beta

Étape 3 : tester la configuration

  • Exécuter la commande suivante dans gemini-cli :
    Check the performance of https://developers.chrome.com
    
  • Chrome affiche une boîte de dialogue demandant à l’utilisateur d’autoriser ou non la session de débogage à distance
  • En cliquant sur Allow, le serveur MCP ouvre le site et exécute une analyse des performances

Débogage intégré avec les agents de code

  • La connexion à une instance Chrome active permet de combiner automatisation et contrôle manuel
    • Après avoir trouvé un élément problématique dans DevTools, l’utilisateur peut transmettre cet élément à l’agent de code pour demander une correction
    • Il est également possible de faire de même dans le panneau Network en sélectionnant une requête puis en demandant à l’agent de l’analyser
  • Via le serveur Chrome DevTools MCP, l’accès aux données de panneaux supplémentaires sera progressivement étendu

1 commentaires

 
GN⁺ 2026-03-16
Avis sur Hacker News
  • J’utilise Playwright pour intercepter toutes les requêtes et réponses, puis enregistrer le trafic pertinent pendant que Claude Code parcourt des sites comme YouTube, clique et saisit du texte
    À partir des données ainsi collectées, je génère automatiquement une API fortement typée afin de pouvoir interagir avec n’importe quel site web via son API interne
    Bien sûr, cela enfreint peut-être les conditions d’utilisation, mais l’avantage est qu’il n’est pas nécessaire de charger toutes les publicités, images et le balisage
    Si ça intéresse du monde, je prévois de le publier cette semaine

    • C’est intéressant de voir que HN aime cette idée
      En réalité, c’est déjà la méthode utilisée par des fabricants de LLM comme Anthropic ou OpenAI
      C’est ironique : quand ils contournent les publicités ou téléchargent des œuvres protégées, c’est présenté comme un « don divin », mais quand Zuck fait la même chose, ce serait une « malédiction démoniaque »
    • J’utilise aussi quelque chose de similaire
      Principalement pour reproduire la mise en page et les styles d’une page à partir de points précis de l’arbre DOM, ou pour capturer automatiquement les comportements responsives
      Avec Playwright, j’ajuste la largeur de l’écran pour suivre les changements de style, et j’enregistre à la fois les captures d’écran et les données de hiérarchie des styles
      Il existe des outils d’inspection manuelle, mais ils sont trop lents et inefficaces
      Personnellement, je trouve bien plus efficace de créer directement un CLI personnalisé plutôt que d’utiliser MCP
      Le vrai point fort, c’est quand l’IA y accède directement et l’exploite via des « skills »
    • Je me demande pourquoi il faudrait absolument utiliser Playwright
      Avec juste agent-browser, Claude devrait pouvoir générer directement du code déterministe
    • J’espère vraiment que tu le publieras. Je me demande si tu en as fait une agent skill
    • Avec cette approche, je me demande aussi s’il serait possible de télécharger directement des vidéos YouTube sans avoir à faire des mises à jour en continu comme yt-dlp
  • Le projet DevTools MCP a récemment lancé un CLI autonome
    D’après la documentation de chrome-devtools-cli, il est inclus dans la version v0.20.0
    C’est une bonne nouvelle pour ceux qui se souciaient du coût en tokens de MCP
    (Pour information, j’ai travaillé dans l’équipe DevTools, et j’y travaille toujours)

    • Désormais, grâce à Tool Search, MCP n’a plus de coût dans CC
  • J’utilise TideWave depuis quelques mois
    tidewave.ai était à l’origine basé sur Elixir/LiveView, mais prend maintenant aussi en charge les frameworks JS et RoR
    Cet outil permet d’accéder non seulement au navigateur, mais aussi au runtime de l’application
    Autrement dit, l’agent peut accéder directement à la base de données et aux endpoints, ce qui le rend très puissant

  • Google est très en retard sur le codage en CLI agentique
    Gemini CLI est tellement mauvais qu’il est évident qu’ils ne l’utilisent même pas en interne
    Je pense que MCP est déjà une technologie morte. Les outils CLI sont plus rapides et plus souples, et il existe déjà beaucoup d’environnements entraînés
    Pour un développeur sérieux, la voie normale, c’est d’utiliser Playwright et headless Chromium
    MCP n’attire que les débutants

    • Je travaille dans un grand environnement enterprise, et MCP reste utile à cause de l’authentification, du RBAC, du rate limiting et de la gestion opérationnelle
      Avec uniquement des CLI, la sécurité et la complexité opérationnelle deviennent trop importantes
      En revanche, je suis d’accord sur le fait que Gemini CLI est médiocre
    • Je suis d’accord avec l’idée que MCP est mort
      Anthropic a tenté des améliorations, mais le problème de gonflement du contexte reste entier
      Les serveurs MCP occupent du contexte même lorsqu’on ne les utilise pas
      Il faut désormais passer aux agent skills
    • Pour info, Gemini CLI est effectivement largement utilisé en interne chez Google
      Ils utilisent des services MCP pour la recherche de code, l’accès à la documentation, la consultation de bugs et la connexion à des bases de données RAG
      (Je l’ai entendu directement de personnes chez Google)
    • Si MCP est mort, je me demande quel CLI il faut utiliser pour ouvrir Chrome, cliquer sur des boutons et lire la sortie de la console
      Et si MCP consomme du contexte, je me demande aussi si les skills CLI sont gratuites
  • Il existe déjà une agent skill qui implémente cette fonctionnalité
    J’utilise chrome-cdp-skill tous les jours, et c’est vraiment excellent
    Par exemple, avec codex, j’ai pu gérer une bibliothèque musicale locale, ouvrir un onglet YT Music, rechercher un album et transmettre l’URL à yt-dlp
    En revanche, pour l’instant, c’est réservé à Chrome, donc si vous utilisez un autre navigateur, il faut modifier le chemin du binaire

    • C’est une démo impressionnante, mais je trouve inquiétant qu’une seule prompt injection puisse donner accès à toutes les données
    • Ce n’est pas une skill pour DevTools MCP, mais un projet indépendant
      Le domaine de l’automatisation de navigateur + agent est déjà très concurrentiel
      DevTools MCP et le nouveau CLI sont maintenus par l’équipe Chrome DevTools & Puppeteer, donc cela semble plus fiable
      Cela dit, c’est bien de voir que la concurrence open source produit de l’innovation
    • Je me demande si des gens utilisent vraiment ce genre de skill bricolée en pratique
      À mon avis, il vaudrait mieux utiliser un outil stable comme playwriter.dev
  • J’ai créé un proxy WebSocket + extension Chrome pour permettre à un agent de contrôler le DOM
    Je l’ai configuré pour permettre l’accès avec des cookies de session via browserbox
    Pour l’instant, je m’en sers comme middleware de recherche pour améliorer le taux de réussite de l’utilisation des outils par les agents

  • J’utilise ce MCP depuis assez longtemps, et c’est avec codex on opencode qu’il a été le plus stable
    J’ai été particulièrement impressionné en l’utilisant comme REPL d’édition SVG : il a généré automatiquement de superbes icônes personnalisées
    Il convient aussi très bien au reverse engineering ou aux travaux d’extension dans des applications Electron

  • J’ai essayé playwriter, et le fait qu’il se connecte à une session existante a fonctionné étonnamment bien

  • J’ai moi aussi implémenté quelque chose de similaire avec Playwright
    Avant, la consommation de tokens était si élevée que cela coûtait cher, mais j’ai résolu le problème en créant un wrapper qui enregistre les résultats sur disque et permet à l’agent de les interroger
    C’est visible sur uisnap.dev
    Je me demande si ce projet a résolu le problème de consommation de tokens

    • Cela semble en grande partie résolu. Voir aussi playwright-cli
    • J’utilise un serveur MCP wrapper qui résume les instantanés de page avec Claude Haiku
      C’est disponible sur playwright-slim-mcp
  • J’ai essayé firefox-devtools-mcp, et c’était bien plus rapide et efficace que le MCP Chrome de base