6 points par xguru 2021-07-08 | Aucun commentaire pour le moment. | Partager sur WhatsApp
<p>- Un langage et une bibliothèque Python pour extraire facilement les informations souhaitées de Wikipédia <br /> → les données de Wikipédia sont faciles à lire pour les humains, mais ne sont que partiellement structurées et difficiles à extraire automatiquement<br /> - Objectifs de mise en œuvre <br /> → développer un langage de requête facile à utiliser et à mémoriser, clair et puissant<br /> → utilisation de sélecteurs similaires à CSS <br /> → récupération des métadonnées via l’API MediaWiki<br /> → récupération du contenu des pages en HTML via l’API `action=parse` </p>

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.