24 points par xguru 2025-02-10 | 1 commentaires | Partager sur WhatsApp
  • En exécutant le serveur API sur une machine locale et en envoyant une URL, on récupère les données du site sous forme de fichiers, avec en plus des captures d’écran de plusieurs zones du site
  • Fait défiler la page pour prendre des captures d’écran de plusieurs sections
  • S’exécute dans un conteneur Docker et utilise Playwright pour lancer le navigateur Firefox, ce qui entraîne une consommation de ressources un peu élevée
  • Les tâches sont traitées via une file d’attente, avec une bonne gestion des en-têtes HTTP, des redirections 302 et des liens de téléchargement
  • API bloquante

1 commentaires

 
xguru 2025-02-10

Dans les commentaires Hacker News, il y a pas mal d’alternatives intéressantes à ça.