2 points par GN⁺ 2025-04-08 | 1 commentaires | Partager sur WhatsApp
  • Un outil qui permet de connecter des applications d’IA au navigateur via MCP afin d’automatiser des tâches sur des sites web
    • Par exemple, automatiser le remplissage répétitif de formulaires sur un site web
  • Automatisation des workflows : accélère les tâches et les automatise pour améliorer l’efficacité
  • Tests automatisés : utilise un éditeur IA pour exécuter automatiquement des tests end-to-end du code. Teste les parcours utilisateur, valide les éléments d’interface et vérifie que l’application fonctionne comme prévu dans différents scénarios
  • Automatisation des tâches : permet d’automatiser facilement des tâches web répétitives telles que la collecte de données, le remplissage de formulaires et l’automatisation de workflows, afin de gagner du temps et de réduire les erreurs

Avantages de Browser MCP

  • Vitesse : l’automatisation s’exécute en local, ce qui améliore les performances sans latence réseau.
  • Confidentialité : comme l’automatisation s’exécute en local, l’activité du navigateur reste sur l’appareil et n’est pas envoyée vers un serveur distant.
  • Maintien de la connexion : utilise le profil de navigateur existant pour rester connecté à tous les services.
  • Discrétion : utilise une véritable empreinte de navigateur pour éviter la détection des bots et les CAPTCHA.

Mode d’emploi

  1. Installer l’extension Browser MCP : ajoutez l’extension Browser MCP à votre navigateur.
  2. Configurer le serveur MCP : ajoutez le serveur Browser MCP à l’application d’IA afin de le connecter à l’extension du navigateur.
  3. Lancer l’automatisation : créez des workflows automatisés et laissez l’assistant IA gérer les tâches répétitives dans le navigateur.

Outils de fonctionnalités d’automatisation du navigateur

  • Naviguer : aller vers une URL
  • Retour : revenir à la page précédente
  • Avancer : aller à la page suivante
  • Attendre : attendre pendant une durée spécifiée (en secondes)
  • Appuyer sur une touche : appuyer sur une touche du clavier
  • Capture d’état : capturer un snapshot d’accessibilité de la page actuelle
  • Cliquer : effectuer un clic sur une page web
  • Glisser-déposer : effectuer un glisser-déposer entre deux éléments
  • Survol : passer la souris au-dessus d’un élément de la page
  • Saisie de texte : saisir du texte dans un élément éditable
  • Sélection d’option : sélectionner une option dans un menu déroulant
  • Récupérer les logs de console : récupérer les logs de console du navigateur

Applications d’IA MCP compatibles

  • Cursor
  • Claude
  • Windsurf
  • VSCode

1 commentaires

 
GN⁺ 2025-04-08
Avis Hacker News
  • Le site affirme qu’il « utilise une véritable empreinte de navigateur pour éviter la détection de bots et les CAPTCHA »

    • J’ai essayé des systèmes similaires, mais lorsque l’IA contrôlait le navigateur, des CAPTCHA apparaissaient et j’étais bloqué sur plusieurs sites
    • Quand j’ai cessé d’utiliser des sessions de navigateur, le blocage a été levé, mais cette approche n’est pas une solution miracle
  • Ce système ressemble à une copie dépassée de Playwright-MCP de Microsoft

  • Ce serait utile d’avoir un navigateur capable de filtrer les produits selon des critères précis sur des sites de e-commerce

  • Je ne sais pas ce qu’est MCP, et maintenant j’ai même peur de le demander

  • Une tâche consistant à chercher des informations sur le web et à insérer les résultats dans Google Sheets a presque parfaitement fonctionné au premier essai, puis a échoué lors des tentatives suivantes

    • Je me demande s’il y a un problème de latence entre le navigateur et l’application MCP
    • Au premier essai, j’ai rapidement cliqué sur l’autorisation « autoriser ce chat », mais lors des essais suivants, le LLM signalait un problème de clic
    • Cliquer sur le titre d’une feuille Google Spreadsheet pour saisir un nom a fonctionné au début, puis a échoué ensuite
    • L’identification des cellules A1, B1, etc., et l’insertion dans la ligne ont aussi réussi au premier essai, puis ont échoué ensuite
    • Le premier essai était presque parfait, mais il est impossible de le reproduire à 100 % par la suite
    • L’expérience est fluide, et la configuration comme l’exécution sont excellentes
  • Lors de tests avec Claude Desktop, cela a fonctionné de manière fluide et avec moins de friction que Playwright

    • Ce serait bien d’avoir une fonction qui détecte un CAPTCHA sur la page, suspend l’automatisation et avertit l’utilisateur
    • Playwright continue d’essayer malgré le CAPTCHA
  • Ce serait bien de pouvoir naviguer dans la page en utilisant l’arbre d’accessibilité des outils de développement de Chrome

  • Cela suscite de l’espoir pour les tâches manuelles, notamment les demandes de remboursement

    • Chaque mois, devoir se connecter au prestataire de service, télécharger les relevés, rédiger un document Google, écrire un e-mail et téléverser des fichiers est fastidieux
    • L’automatisation est déjà possible, et une vraie application de suivi des dépenses pourrait réduire de moitié ce travail
    • Les outils d’IA ont le potentiel d’éliminer les spécifications trop détaillées
    • Ces workflows sont souvent affectés par de petits changements
  • Je me demande si MCP est le nouveau RPA (automatisation robotisée des processus)

  • Je fais quelque chose de similaire pour contrôler des synthés hardware et concevoir des sons sans toucher physiquement aux boutons