16 points par GN⁺ 2025-01-10 | 1 commentaires | Partager sur WhatsApp
  • Stagehand est un framework simple et extensible de navigation web par IA, entièrement compatible avec Playwright
    • Il fournit trois API IA simples, act, extract et observe, pour permettre l’automatisation web en langage naturel
    • Il le rend plus accessible même aux utilisateurs non techniques et moins vulnérable aux petites modifications de l’UI/du DOM
    • Exemples : extraire les principales actualités sur Hacker News, rechercher et acheter des AirPods sur Amazon, rechercher les statistiques des 10 derniers matchs de Steph Curry sur ESPN
  • Il permet d’écrire facilement du code d’automatisation de navigateur robuste et performant.
  • Utilisé avec Browserbase, il offre d’excellents outils de débogage comme la relecture de session et le débogage étape par étape.
  • Stagehand est en phase de version initiale et collecte activement les retours de la communauté.
  • Licence MIT

1 commentaires

 
GN⁺ 2025-01-10
Avis Hacker News
  • Certains estiment que, lors de l’extraction de données d’une page avec Stagehand, il serait utile de renvoyer des éléments xpath permettant de re-scraper la page sans utiliser de LLM

    • Lors du scraping d’une nouvelle page, on peut utiliser des outils LLM non déterministes, puis recourir à des méthodes de scraping traditionnelles pour re-scraper lors des mises à jour de contenu
    • Des questions sont soulevées sur la stabilité de la transition de la version LLM vers une version xcode, et sur la possibilité de revenir à la version LLM si le script xcode échoue
    • Certains pensent qu’il serait utile de constituer au fil du temps une bibliothèque de scripts de scraping simples après avoir scrapé avec des outils intelligents
  • Certains ne sont pas d’accord avec l’idée que Stagehand devrait remplacer Playwright et autres

    • Personnellement, ils aimeraient l’utiliser comme workflow intermédiaire pour générer du code Playwright déterministe, mais l’outil semble conçu pour une exécution directe
    • Il serait difficile de convaincre d’utiliser un LLM à l’exécution dans une suite de tests en cours de développement
  • Quelqu’un a essayé d’implémenter une automatisation de workflow avec un framework similaire, mais s’est retrouvé bloqué à cause de CAPTCHA invisibles

    • Une instance Playwright peut être détectée à cause de sa manière d’interagir avec le DOM
    • Certains pensent que le crawling et le scraping deviennent hors de contrôle et que cela pourrait devenir la norme
  • Certains jugent que le nom "create-browser-app" est trop générique et qu’il aurait fallu le nommer "stagehand"

  • Avant de construire une plateforme de test pour testdriver.ai, quelqu’un avait créé un SDK similaire appelé Goodlooks, mais il n’avait pas suscité beaucoup de réactions

    • Le lien est partagé pour les personnes intéressées
  • Après avoir essayé Stagehand, certains ont constaté que c’était une abstraction utile

    • C’est pratique pour construire des scrapers visant des sites hostiles, grâce aux proxies et CAPTCHA intégrés
    • Ils se demandent s’il est prévu de faire une abstraction similaire pour MCP et l’usage de l’ordinateur
  • Certains apprécient que Stagehand se concentre sur le renforcement de l’automatisation du navigateur face aux changements du DOM

    • Les méthodes act, extract et observe sont très propres
    • Recommandation de Lightpanda, un navigateur headless léger open source
  • Certains se demandent s’il est possible d’automatiser un onglet de navigateur déjà ouvert

  • Quelqu’un suit sur Slack l’impressionnante vitesse de développement produit de cette équipe et attend avec intérêt la suite

  • Certains se demandent si cela fonctionne en convertissant les méthodes IA en sous-méthodes de Playwright, et s’il est possible de déboguer les méthodes réelles ainsi converties

    • Ils s’interrogent sur le fait que des commandes différentes puissent être produites à chaque exécution de test, ou s’il existe un comportement déterministe