- Cloudflare a annoncé son intention de lancer l’an prochain une marketplace permettant aux propriétaires de sites web de vendre aux fournisseurs de modèles d’IA l’accès de scraping au contenu de leur site
- Cette marketplace constitue la dernière étape d’un plan plus large du CEO de Cloudflare, Matthew Prince, visant à donner aux éditeurs un meilleur contrôle sur la manière et le moment où les bots d’IA scrapent leurs sites web
- Comme première étape, Cloudflare a lancé AI Audit, un outil gratuit d’observability
- Les propriétaires de sites web disposent d’un tableau de bord montrant des analyses sur la fréquence à laquelle les modèles d’IA scrapent leur site
- Avec AI Audit, les propriétaires de sites web peuvent bloquer les bots d’IA ou autoriser certains web scrapers spécifiques
- La démo d’AI Audit permet aux propriétaires de sites web de voir d’où vient chaque scraper et propose une fenêtre optionnelle pour voir à quelle fréquence des fournisseurs de modèles d’IA comme OpenAI, Meta et Amazon visitent le site
- Résoudre un problème de l’industrie de l’IA
- Les fournisseurs de modèles d’IA scrapent des milliers de petits sites web pour alimenter les informations utilisées par les LLM
- La plupart des sites web ne reçoivent aucune compensation, ce qui peut casser le modèle économique de nombreux sites
- Cloudflare a lancé un bouton permettant aux propriétaires de sites web de bloquer les bots d’IA
- Prendre en compte les demandes des clients
- Les clients de Cloudflare demandaient des outils leur permettant de choisir quels modèles d’IA peuvent accéder à leur site
- Le nouvel outil de Cloudflare permet de bloquer certains crawlers d’IA tout en en autorisant d’autres
- Objectif de la marketplace
- La marketplace de Cloudflare permettra aux petits éditeurs de conclure des accords avec des fournisseurs de modèles d’IA
- Les sites web pourront fixer un tarif de scraping ou demander des crédits aux laboratoires d’IA
- Impact sur l’écosystème IA
- La situation actuelle, dans laquelle certaines entreprises d’IA ne paient rien pour les contenus, n’est pas durable
- Le CEO de Cloudflare estime que cette marketplace sera au final bénéfique pour l’écosystème IA
Le résumé de GN⁺
- Cloudflare a annoncé son projet de lancer une marketplace permettant aux propriétaires de sites web de vendre aux fournisseurs de modèles d’IA l’accès de scraping au contenu de leur site
- Grâce à l’outil AI Audit, les propriétaires de sites web peuvent analyser la fréquence à laquelle les modèles d’IA scrapent leur site
- Cette marketplace permettra aux petits éditeurs de conclure des accords avec des fournisseurs de modèles d’IA, afin d’être rémunérés pour leurs contenus
- Cela pourrait contribuer à améliorer la durabilité de l’écosystème IA
2 commentaires
L’intention est bonne.
Avis Hacker News
Common Crawl est inclus dans la liste des « Providers » avec OpenAI et Antropic
OpenFoodFacts, OpenStreetMap et Wikipedia subissent des attaques DDoS
Empêcher le crawling pourrait être une tâche vaine
Cloudflare propose un service de protection contre les abus d’une nouvelle manière
Des interrogations sur l’avenir du World Wide Web
Plus de détails sont disponibles sur le blog de Cloudflare
Exemple de Bingeclock avec AI Audit
Étape suivante : générer du contenu avec l’IA générative, puis être payé quand Cloudflare le scanne
Scraper le même site de manière répétée est un énorme gaspillage