Astuces pour contourner la détection de bots de Playwright
(github.com/greekr4)Quand on accède à un site avec Playwright, on se fait souvent bloquer immédiatement par les systèmes de détection de bots. J’ai essayé les snippets « stealth » qui circulent sur Internet, mais certains se faisaient au contraire encore mieux repérer. J’ai donc mesuré directement le résultat avec 8 détecteurs et n’ai retenu que les combinaisons qui passent réellement, pour en faire une skill.
Installation / utilisation
- Installation :
npx skills add greekr4/playwright-bot-bypass - Utilisation : appeler
playwright-bot-bypass
Ce qui m’a un peu surpris
- Les falsifications de
navigatorcouramment utilisées (faux plugins, bruit sur le canvas, suppression dewebdriver, etc.) correspondent subtilement mal à un vrai Chrome, et deviennent au contraire des signaux de détection. L’une d’elles a même provoqué un crash sur un vrai Chrome - J’ai donc retiré toute falsification, laissé faire un vrai Chrome (headed), puis supprimé uniquement 2 traces propres à Playwright (
__pwInitScripts+ blocage de la fuite CDP de rebrowser) - La conclusion, c’est : « moins on en fait, moins on se fait repérer »
Les retours sont les bienvenus — en particulier si vous avez des signalements du type « ce détecteur-là, je n’ai pas réussi à le passer », je les prendrai en compte.
Aucun commentaire pour le moment.