🚨 Aperçu de l’incident
Le 4 août 2025, Cloudflare a publiquement critiqué Perplexity, un moteur de recherche IA, comme un « transgresseur des standards du web ».
⚔️ Arguments des deux camps
Position de Cloudflare : « crawl furtif »
- Perplexity contourne le blocage du crawling en 4 étapes
- Tentative d’accès via un bot officiel
- Changement immédiat de tactique en cas de blocage
- Déguisement en navigateur Chrome
- Réaccès avec changement d’adresses IP
- Les sites bloqués via robots.txt seraient collectés sans autorisation pour fournir des résumés
Réponse de Perplexity : « agent délégué de l’utilisateur »
- Une IA pour traiter les requêtes utilisateur, pas un crawler traditionnel
- Les contenus ne sont pas stockés et ne sont utilisés que pour des réponses en temps réel
- Cloudflare prétend avoir mal analysé le trafic BrowserBase
💡 Opinion de l’auteur : l’approche de Cloudflare est plus raisonnable
- La dissimulation d’identité n’est pas une pratique légitime
- robots.txt est une norme du web respectée depuis 1994
- Un modèle parasitaire qui détourne les revenus des sites d’origine
- Des exemples vertueux de conformité existent, comme OpenAI
🔮 Perspectives
- Révision de robots.txt à l’ère de l’IA
- Mise en place d’un cadre d’authentification pour les crawlers IA
- Diffusion de la monétisation de l’accès aux contenus
- Renforcement de la régulation juridique
Aucun commentaire pour le moment.