- Le serveur Chrome DevTools MCP a été amélioré pour permettre aux agents de code de se connecter directement à une session de navigateur active
- Grâce à cette fonctionnalité, les agents peuvent réutiliser une session déjà connectée ou accéder à la session de débogage active de DevTools
- Dans Chrome M144 (bêta), l’option
--autoConnect permet au serveur MCP de se connecter automatiquement à une instance Chrome en cours d’exécution
- À chaque connexion, une boîte de dialogue d’approbation utilisateur s’affiche, et pendant le débogage, une bannière « automated test software » indique que le navigateur est contrôlé
- Il devient possible de basculer librement entre débogage manuel et débogage assisté par IA, ce qui améliore l’efficacité du développement
Aperçu des améliorations du serveur Chrome DevTools MCP
- Le serveur Chrome DevTools MCP a été mis à jour pour permettre aux agents de code de se connecter directement à une session de navigateur active
- Les utilisateurs peuvent réutiliser une session déjà connectée et déboguer sans devoir se reconnecter
- Il est possible de demander à l’agent d’examiner un élément sélectionné dans le panneau Network ou le panneau Elements de l’interface DevTools
- Les méthodes de connexion existantes restent disponibles, avec utilisation d’un profil dédié au serveur MCP, connexion à un port de débogage distant et exécution de plusieurs instances basées sur des profils temporaires
Fonctionnement (How it works)
- Chrome M144 (actuellement en bêta) ajoute une fonction de demande de connexion de débogage à distance
- Lorsque le serveur MCP est lancé avec l’option
--autoConnect, il se connecte automatiquement à l’instance Chrome active et demande une session de débogage à distance
- Pour renforcer la sécurité, Chrome affiche une boîte de dialogue d’approbation utilisateur à chaque demande, et n’autorise la connexion qu’après validation
- Une fois la session de débogage activée, une bannière « Chrome is being controlled by automated test software » s’affiche en haut du navigateur
Prise en main (Get started)
- Pour utiliser la nouvelle fonctionnalité de débogage à distance, il faut activer le débogage à distance dans Chrome et configurer le serveur MCP
Étape 1 : configurer le débogage à distance dans Chrome
- Aller sur
chrome://inspect/#remote-debugging pour activer le débogage à distance
- Choisir via la boîte de dialogue s’il faut autoriser ou non la connexion de débogage
Étape 2 : configurer la connexion automatique du serveur MCP
- Lors du lancement du serveur
chrome-devtools-mcp, ajouter l’argument --autoConnect
- Exemple de configuration (gemini-cli) :
{
"mcpServers": {
"chrome-devtools": {
"command": "npx",
"args": [
"chrome-devtools-mcp@latest",
"--autoConnect",
"--channel=beta"
]
}
}
}
- Tant que Chrome M144 n’a pas atteint le canal stable, il faut préciser
--channel=beta
Étape 3 : tester la configuration
Débogage intégré avec les agents de code
- La connexion à une instance Chrome active permet de combiner automatisation et contrôle manuel
- Après avoir trouvé un élément problématique dans DevTools, l’utilisateur peut transmettre cet élément à l’agent de code pour demander une correction
- Il est également possible de faire de même dans le panneau Network en sélectionnant une requête puis en demandant à l’agent de l’analyser
- Via le serveur Chrome DevTools MCP, l’accès aux données de panneaux supplémentaires sera progressivement étendu
1 commentaires
Avis sur Hacker News
J’utilise Playwright pour intercepter toutes les requêtes et réponses, puis enregistrer le trafic pertinent pendant que Claude Code parcourt des sites comme YouTube, clique et saisit du texte
À partir des données ainsi collectées, je génère automatiquement une API fortement typée afin de pouvoir interagir avec n’importe quel site web via son API interne
Bien sûr, cela enfreint peut-être les conditions d’utilisation, mais l’avantage est qu’il n’est pas nécessaire de charger toutes les publicités, images et le balisage
Si ça intéresse du monde, je prévois de le publier cette semaine
En réalité, c’est déjà la méthode utilisée par des fabricants de LLM comme Anthropic ou OpenAI
C’est ironique : quand ils contournent les publicités ou téléchargent des œuvres protégées, c’est présenté comme un « don divin », mais quand Zuck fait la même chose, ce serait une « malédiction démoniaque »
Principalement pour reproduire la mise en page et les styles d’une page à partir de points précis de l’arbre DOM, ou pour capturer automatiquement les comportements responsives
Avec Playwright, j’ajuste la largeur de l’écran pour suivre les changements de style, et j’enregistre à la fois les captures d’écran et les données de hiérarchie des styles
Il existe des outils d’inspection manuelle, mais ils sont trop lents et inefficaces
Personnellement, je trouve bien plus efficace de créer directement un CLI personnalisé plutôt que d’utiliser MCP
Le vrai point fort, c’est quand l’IA y accède directement et l’exploite via des « skills »
Avec juste agent-browser, Claude devrait pouvoir générer directement du code déterministe
Le projet DevTools MCP a récemment lancé un CLI autonome
D’après la documentation de chrome-devtools-cli, il est inclus dans la version v0.20.0
C’est une bonne nouvelle pour ceux qui se souciaient du coût en tokens de MCP
(Pour information, j’ai travaillé dans l’équipe DevTools, et j’y travaille toujours)
J’utilise TideWave depuis quelques mois
tidewave.ai était à l’origine basé sur Elixir/LiveView, mais prend maintenant aussi en charge les frameworks JS et RoR
Cet outil permet d’accéder non seulement au navigateur, mais aussi au runtime de l’application
Autrement dit, l’agent peut accéder directement à la base de données et aux endpoints, ce qui le rend très puissant
Google est très en retard sur le codage en CLI agentique
Gemini CLI est tellement mauvais qu’il est évident qu’ils ne l’utilisent même pas en interne
Je pense que MCP est déjà une technologie morte. Les outils CLI sont plus rapides et plus souples, et il existe déjà beaucoup d’environnements entraînés
Pour un développeur sérieux, la voie normale, c’est d’utiliser Playwright et headless Chromium
MCP n’attire que les débutants
Avec uniquement des CLI, la sécurité et la complexité opérationnelle deviennent trop importantes
En revanche, je suis d’accord sur le fait que Gemini CLI est médiocre
Anthropic a tenté des améliorations, mais le problème de gonflement du contexte reste entier
Les serveurs MCP occupent du contexte même lorsqu’on ne les utilise pas
Il faut désormais passer aux agent skills
Ils utilisent des services MCP pour la recherche de code, l’accès à la documentation, la consultation de bugs et la connexion à des bases de données RAG
(Je l’ai entendu directement de personnes chez Google)
Et si MCP consomme du contexte, je me demande aussi si les skills CLI sont gratuites
Il existe déjà une agent skill qui implémente cette fonctionnalité
J’utilise chrome-cdp-skill tous les jours, et c’est vraiment excellent
Par exemple, avec codex, j’ai pu gérer une bibliothèque musicale locale, ouvrir un onglet YT Music, rechercher un album et transmettre l’URL à yt-dlp
En revanche, pour l’instant, c’est réservé à Chrome, donc si vous utilisez un autre navigateur, il faut modifier le chemin du binaire
Le domaine de l’automatisation de navigateur + agent est déjà très concurrentiel
DevTools MCP et le nouveau CLI sont maintenus par l’équipe Chrome DevTools & Puppeteer, donc cela semble plus fiable
Cela dit, c’est bien de voir que la concurrence open source produit de l’innovation
À mon avis, il vaudrait mieux utiliser un outil stable comme playwriter.dev
J’ai créé un proxy WebSocket + extension Chrome pour permettre à un agent de contrôler le DOM
Je l’ai configuré pour permettre l’accès avec des cookies de session via browserbox
Pour l’instant, je m’en sers comme middleware de recherche pour améliorer le taux de réussite de l’utilisation des outils par les agents
J’utilise ce MCP depuis assez longtemps, et c’est avec codex on opencode qu’il a été le plus stable
J’ai été particulièrement impressionné en l’utilisant comme REPL d’édition SVG : il a généré automatiquement de superbes icônes personnalisées
Il convient aussi très bien au reverse engineering ou aux travaux d’extension dans des applications Electron
J’ai essayé playwriter, et le fait qu’il se connecte à une session existante a fonctionné étonnamment bien
J’ai moi aussi implémenté quelque chose de similaire avec Playwright
Avant, la consommation de tokens était si élevée que cela coûtait cher, mais j’ai résolu le problème en créant un wrapper qui enregistre les résultats sur disque et permet à l’agent de les interroger
C’est visible sur uisnap.dev
Je me demande si ce projet a résolu le problème de consommation de tokens
C’est disponible sur playwright-slim-mcp
J’ai essayé firefox-devtools-mcp, et c’était bien plus rapide et efficace que le MCP Chrome de base