3 points par GN⁺ 2023-10-05 | 1 commentaires | Partager sur WhatsApp
  • Le texte présente Graph Mining Library, un projet qui regroupe des outils développés par l’équipe Google Graph Mining.
  • Ces outils sont conçus pour résoudre des problèmes de data mining et de machine learning dont la structure est intrinsèquement un graphe ou qui peuvent être formulés comme des problèmes de graphes.
  • Cette bibliothèque comprend des algorithmes de clustering parallèle en mémoire partagée capables de traiter des graphes comportant des dizaines de milliards d’arêtes.
  • Ces algorithmes s’appuient sur plusieurs articles de recherche, notamment « Hierarchical Agglomerative Graph Clustering in Poly-Logarithmic Depth », « Scalable community detection via parallel correlation clustering », « Affinity Clustering: Hierarchical Clustering at Scale » et « Distributed Balanced Partitioning via Linear Embedding ».
  • Des liens sont fournis vers des sections spécifiques du dépôt associées à chaque article.
  • En cas de question ou de commentaire, les utilisateurs sont encouragés à créer une issue dans le dépôt.
  • Le texte propose également un guide de démarrage rapide expliquant comment installer Bazel et exécuter des exemples.

1 commentaires

 
GN⁺ 2023-10-05
Avis Hacker News
  • Avec l’essor des réseaux sociaux, le graph mining a gagné en popularité il y a dix ans.
  • Il est resté populaire jusqu’à ce que l’apprentissage géométrique, les formes de machine learning sur les graphes et d’autres structures, ainsi que les modèles d’allocation de Dirichlet latente (LMMs), se diffusent plus largement.
  • Le système de base de données Arangodb inclut des intégrations avec diverses bibliothèques de graphes et frameworks de machine learning, comme NetworkX, DeepGraphLibrary, cuGraph et PyG.
  • Une question porte sur la manière de construire la bibliothèque avec Bazel, un outil d’automatisation de la compilation et des tests logiciels.
  • La bibliothèque peut s’intégrer à des wrappers ou à des bibliothèques d’extension pour intégrer des algorithmes de clustering fondés sur les graphes.
  • Une question porte sur la relation entre Pregel, un système de traitement de graphes à grande échelle, et la bibliothèque.
  • Une demande a été faite pour expliquer les usages potentiels de la bibliothèque et fournir des exemples d’application.
  • La bibliothèque est écrite en C, C++, Starland, et une question est posée sur ce qu’est Starland.
  • Comme pour Basic Linear Algebra Subprograms (BLAS) et Linear Algebra Package (LAPACK), certaines voix appellent à une standardisation des algorithmes de graphes.
  • Certains espéraient que la bibliothèque puisse être utilisée pour le graph mining statistique destiné à la détection d’anomalies.