Analyseur Robots.txt pour NodeJS
(github.com)-
Développé avec pour objectif d’être compatible avec le draft IETF du Robots Exclusion Protocol
-
Règles prises en charge
→ User-agent, Allow, Disallow, Sitemap, Crawl-delay, Host
→ Chemin : correspondance avec wildcard(*) et fin de ligne ($)
1 commentaires