- Solution de scraping web auto-hébergée permettant de collecter et d’extraire des données de sites web sans écrire de code
- Fournit un workflow no-code pour créer et gérer des tâches depuis une interface utilisateur basée sur le navigateur
- Avec l’extraction basée sur XPath, il est possible de cibler précisément les éléments d’une page, et la gestion de file d’attente ainsi que le spidering de domaine permettent de scraper toutes les pages d’un même domaine
- Possibilité d’ajouter des en-têtes JSON aux requêtes de scraping, téléchargement automatique des médias comme les images et vidéos, et prise en charge de la visualisation des données scrapées sous forme de tableaux structurés
- Prise en charge de l’export Markdown/CSV et envoi de notifications de fin via différents canaux
- Démarrage rapide en local ou en environnement de cluster via des déploiements Docker et Helm
Aucun commentaire pour le moment.