Vercel lance agent-browser et la fonctionnalité --native
(agent-browser.dev)- CLI d’automatisation de navigateur headless pour les agents IA
- Changement d’architecture : au lieu de la structure existante node.js + playwright + CDP, un binaire Rust appelle désormais CDP directement
- Fonctionne comme un démon autonome, sans processus Node.js à l’exécution, ce qui réduit l’utilisation mémoire et l’empreinte globale
- Commandes de workflow adaptées à l’IA
- La commande
snapshotrécupère l’arbre d’accessibilité et génère des ref uniques (@e1, @e2), utilisés comme base de fonctionnement (les sélecteurs traditionnels restent pris en charge) - Navigation dans les pages (
open,goto), clic et saisie (click,fill,type,hover,check, ..), génération de captures d’écran et de PDF (screenshot,pdf) - Consultation d’état (
get text,get attr), vérification d’état (is), attente (wait), contrôle de la souris et du clavier (mouse,keyboard) - Recherche d’éléments (
find), réglages du navigateur (set), onglets/fenêtres/frames/dialogues (tab,window,frame,dialog) - Comparaison (
diff) : comparaison via snapshot, capture d’écran, URL, etc. - Gestion des sessions, du stockage et des cookies (
cookie,storage), avec prise en charge de l’interception et du mocking des requêtes réseau (network route)
- La commande
- Avec
--session, exécution d’une instance de navigateur isolée - Avec
--profileou--session-name, conservation de l’état de connexion et du stockage - L’option
--annotatepermet de générer des captures d’écran annotées avec la numérotation des éléments - Fournit des binaires Rust dédiés pour macOS, Linux et Windows, avec fallback Node.js
- Licence Apache-2.0
2 commentaires
Je l’utilise vraiment énormément. L’efficacité des tokens est également bonne.
Je me rends compte que je n’avais jamais présenté agent-browser. Il y a tellement de nouveautés en ce moment que ça a dû m’échapper, haha.
Une nouvelle option expérimentale, l’argument
--native, a été ajoutée, ce qui l’a rendu plus petit et plus rapide.https://x.com/ctatedev/status/2028960626685386994
C’est un autre projet de Chris Tate, le créateur de portless - un outil qui remplace les numéros de port par des URL
.localhostbasées sur des noms.