WikipediaQL - langage de requête pour Wikipédia
(github.com)<p>- Un langage et une bibliothèque Python pour extraire facilement les informations souhaitées de Wikipédia <br />
→ les données de Wikipédia sont faciles à lire pour les humains, mais ne sont que partiellement structurées et difficiles à extraire automatiquement<br />
- Objectifs de mise en œuvre <br />
→ développer un langage de requête facile à utiliser et à mémoriser, clair et puissant<br />
→ utilisation de sélecteurs similaires à CSS <br />
→ récupération des métadonnées via l’API MediaWiki<br />
→ récupération du contenu des pages en HTML via l’API `action=parse` </p>
Aucun commentaire pour le moment.