Chrome DevTools MCP

(developer.chrome.com)

3 points par GN⁺ 2026-03-16 | 1 commentaires | Partager sur WhatsApp

Le serveur Chrome DevTools MCP a été amélioré pour permettre aux agents de code de se connecter directement à une session de navigateur active
Grâce à cette fonctionnalité, les agents peuvent réutiliser une session déjà connectée ou accéder à la session de débogage active de DevTools
Dans Chrome M144 (bêta), l’option --autoConnect permet au serveur MCP de se connecter automatiquement à une instance Chrome en cours d’exécution
À chaque connexion, une boîte de dialogue d’approbation utilisateur s’affiche, et pendant le débogage, une bannière « automated test software » indique que le navigateur est contrôlé
Il devient possible de basculer librement entre débogage manuel et débogage assisté par IA, ce qui améliore l’efficacité du développement

Aperçu des améliorations du serveur Chrome DevTools MCP

Le serveur Chrome DevTools MCP a été mis à jour pour permettre aux agents de code de se connecter directement à une session de navigateur active
- Les utilisateurs peuvent réutiliser une session déjà connectée et déboguer sans devoir se reconnecter
- Il est possible de demander à l’agent d’examiner un élément sélectionné dans le panneau Network ou le panneau Elements de l’interface DevTools
Les méthodes de connexion existantes restent disponibles, avec utilisation d’un profil dédié au serveur MCP, connexion à un port de débogage distant et exécution de plusieurs instances basées sur des profils temporaires

Fonctionnement (How it works)

Chrome M144 (actuellement en bêta) ajoute une fonction de demande de connexion de débogage à distance
- Lorsque le serveur MCP est lancé avec l’option --autoConnect, il se connecte automatiquement à l’instance Chrome active et demande une session de débogage à distance
Pour renforcer la sécurité, Chrome affiche une boîte de dialogue d’approbation utilisateur à chaque demande, et n’autorise la connexion qu’après validation
Une fois la session de débogage activée, une bannière « Chrome is being controlled by automated test software » s’affiche en haut du navigateur

Prise en main (Get started)

Pour utiliser la nouvelle fonctionnalité de débogage à distance, il faut activer le débogage à distance dans Chrome et configurer le serveur MCP

Étape 1 : configurer le débogage à distance dans Chrome

Aller sur chrome://inspect/#remote-debugging pour activer le débogage à distance
Choisir via la boîte de dialogue s’il faut autoriser ou non la connexion de débogage

Étape 2 : configurer la connexion automatique du serveur MCP

Lors du lancement du serveur chrome-devtools-mcp, ajouter l’argument --autoConnect

Exemple de configuration (gemini-cli) :

{
   "mcpServers": {
    "chrome-devtools": {
      "command": "npx",
      "args": [
        "chrome-devtools-mcp@latest",
        "--autoConnect",
        "--channel=beta"
      ]
    }
  }
}

Tant que Chrome M144 n’a pas atteint le canal stable, il faut préciser --channel=beta

Étape 3 : tester la configuration

Exécuter la commande suivante dans gemini-cli :

Check the performance of https://developers.chrome.com

Chrome affiche une boîte de dialogue demandant à l’utilisateur d’autoriser ou non la session de débogage à distance
En cliquant sur Allow, le serveur MCP ouvre le site et exécute une analyse des performances

Débogage intégré avec les agents de code

La connexion à une instance Chrome active permet de combiner automatisation et contrôle manuel
- Après avoir trouvé un élément problématique dans DevTools, l’utilisateur peut transmettre cet élément à l’agent de code pour demander une correction
- Il est également possible de faire de même dans le panneau Network en sélectionnant une requête puis en demandant à l’agent de l’analyser
Via le serveur Chrome DevTools MCP, l’accès aux données de panneaux supplémentaires sera progressivement étendu

1 commentaires

GN⁺ 2026-03-16

Avis sur Hacker News

J’utilise Playwright pour intercepter toutes les requêtes et réponses, puis enregistrer le trafic pertinent pendant que Claude Code parcourt des sites comme YouTube, clique et saisit du texte
À partir des données ainsi collectées, je génère automatiquement une API fortement typée afin de pouvoir interagir avec n’importe quel site web via son API interne
Bien sûr, cela enfreint peut-être les conditions d’utilisation, mais l’avantage est qu’il n’est pas nécessaire de charger toutes les publicités, images et le balisage
Si ça intéresse du monde, je prévois de le publier cette semaine
- C’est intéressant de voir que HN aime cette idée
  En réalité, c’est déjà la méthode utilisée par des fabricants de LLM comme Anthropic ou OpenAI
  C’est ironique : quand ils contournent les publicités ou téléchargent des œuvres protégées, c’est présenté comme un « don divin », mais quand Zuck fait la même chose, ce serait une « malédiction démoniaque »
- J’utilise aussi quelque chose de similaire
  Principalement pour reproduire la mise en page et les styles d’une page à partir de points précis de l’arbre DOM, ou pour capturer automatiquement les comportements responsives
  Avec Playwright, j’ajuste la largeur de l’écran pour suivre les changements de style, et j’enregistre à la fois les captures d’écran et les données de hiérarchie des styles
  Il existe des outils d’inspection manuelle, mais ils sont trop lents et inefficaces
  Personnellement, je trouve bien plus efficace de créer directement un CLI personnalisé plutôt que d’utiliser MCP
  Le vrai point fort, c’est quand l’IA y accède directement et l’exploite via des « skills »
- Je me demande pourquoi il faudrait absolument utiliser Playwright
  Avec juste agent-browser, Claude devrait pouvoir générer directement du code déterministe
- J’espère vraiment que tu le publieras. Je me demande si tu en as fait une agent skill
- Avec cette approche, je me demande aussi s’il serait possible de télécharger directement des vidéos YouTube sans avoir à faire des mises à jour en continu comme yt-dlp
Le projet DevTools MCP a récemment lancé un CLI autonome
D’après la documentation de chrome-devtools-cli, il est inclus dans la version v0.20.0
C’est une bonne nouvelle pour ceux qui se souciaient du coût en tokens de MCP
(Pour information, j’ai travaillé dans l’équipe DevTools, et j’y travaille toujours)
- Désormais, grâce à Tool Search, MCP n’a plus de coût dans CC
J’utilise TideWave depuis quelques mois
tidewave.ai était à l’origine basé sur Elixir/LiveView, mais prend maintenant aussi en charge les frameworks JS et RoR
Cet outil permet d’accéder non seulement au navigateur, mais aussi au runtime de l’application
Autrement dit, l’agent peut accéder directement à la base de données et aux endpoints, ce qui le rend très puissant
Google est très en retard sur le codage en CLI agentique
Gemini CLI est tellement mauvais qu’il est évident qu’ils ne l’utilisent même pas en interne
Je pense que MCP est déjà une technologie morte. Les outils CLI sont plus rapides et plus souples, et il existe déjà beaucoup d’environnements entraînés
Pour un développeur sérieux, la voie normale, c’est d’utiliser Playwright et headless Chromium
MCP n’attire que les débutants
- Je travaille dans un grand environnement enterprise, et MCP reste utile à cause de l’authentification, du RBAC, du rate limiting et de la gestion opérationnelle
  Avec uniquement des CLI, la sécurité et la complexité opérationnelle deviennent trop importantes
  En revanche, je suis d’accord sur le fait que Gemini CLI est médiocre
- Je suis d’accord avec l’idée que MCP est mort
  Anthropic a tenté des améliorations, mais le problème de gonflement du contexte reste entier
  Les serveurs MCP occupent du contexte même lorsqu’on ne les utilise pas
  Il faut désormais passer aux agent skills
- Pour info, Gemini CLI est effectivement largement utilisé en interne chez Google
  Ils utilisent des services MCP pour la recherche de code, l’accès à la documentation, la consultation de bugs et la connexion à des bases de données RAG
  (Je l’ai entendu directement de personnes chez Google)
- Si MCP est mort, je me demande quel CLI il faut utiliser pour ouvrir Chrome, cliquer sur des boutons et lire la sortie de la console
  Et si MCP consomme du contexte, je me demande aussi si les skills CLI sont gratuites
Il existe déjà une agent skill qui implémente cette fonctionnalité
J’utilise chrome-cdp-skill tous les jours, et c’est vraiment excellent
Par exemple, avec codex, j’ai pu gérer une bibliothèque musicale locale, ouvrir un onglet YT Music, rechercher un album et transmettre l’URL à yt-dlp
En revanche, pour l’instant, c’est réservé à Chrome, donc si vous utilisez un autre navigateur, il faut modifier le chemin du binaire
- C’est une démo impressionnante, mais je trouve inquiétant qu’une seule prompt injection puisse donner accès à toutes les données
- Ce n’est pas une skill pour DevTools MCP, mais un projet indépendant
  Le domaine de l’automatisation de navigateur + agent est déjà très concurrentiel
  DevTools MCP et le nouveau CLI sont maintenus par l’équipe Chrome DevTools & Puppeteer, donc cela semble plus fiable
  Cela dit, c’est bien de voir que la concurrence open source produit de l’innovation
- Je me demande si des gens utilisent vraiment ce genre de skill bricolée en pratique
  À mon avis, il vaudrait mieux utiliser un outil stable comme playwriter.dev
J’ai créé un proxy WebSocket + extension Chrome pour permettre à un agent de contrôler le DOM
Je l’ai configuré pour permettre l’accès avec des cookies de session via browserbox
Pour l’instant, je m’en sers comme middleware de recherche pour améliorer le taux de réussite de l’utilisation des outils par les agents
J’utilise ce MCP depuis assez longtemps, et c’est avec codex on opencode qu’il a été le plus stable
J’ai été particulièrement impressionné en l’utilisant comme REPL d’édition SVG : il a généré automatiquement de superbes icônes personnalisées
Il convient aussi très bien au reverse engineering ou aux travaux d’extension dans des applications Electron
J’ai essayé playwriter, et le fait qu’il se connecte à une session existante a fonctionné étonnamment bien
J’ai moi aussi implémenté quelque chose de similaire avec Playwright
Avant, la consommation de tokens était si élevée que cela coûtait cher, mais j’ai résolu le problème en créant un wrapper qui enregistre les résultats sur disque et permet à l’agent de les interroger
C’est visible sur uisnap.dev
Je me demande si ce projet a résolu le problème de consommation de tokens
- Cela semble en grande partie résolu. Voir aussi playwright-cli
- J’utilise un serveur MCP wrapper qui résume les instantanés de page avec Claude Haiku
  C’est disponible sur playwright-slim-mcp
J’ai essayé firefox-devtools-mcp, et c’était bien plus rapide et efficace que le MCP Chrome de base

Chrome DevTools MCP

Aperçu des améliorations du serveur Chrome DevTools MCP

Fonctionnement (How it works)

Prise en main (Get started)

Étape 1 : configurer le débogage à distance dans Chrome

Étape 2 : configurer la connexion automatique du serveur MCP

Étape 3 : tester la configuration

Débogage intégré avec les agents de code

À lire aussi

1 commentaires

Avis sur Hacker News