Core Concepts
Graph-Neuronale-Netze können effizient eingesetzt werden, um Zielknoten in sozialen Netzwerken zu erfassen, insbesondere wenn diese über das Netzwerk verteilt sind.
Abstract
Der Artikel beschreibt einen Ansatz zur effizienten Erfassung von Zielknoten in sozialen Netzwerken mithilfe von Graph-Neuronalen-Netzen (GNN).
Die Hauptbeiträge sind:
- Einsatz von GNNs für die selektive Erfassung von Zielknoten und Nachweis ihrer Überlegenheit gegenüber klassischen Prädiktoren
- Entwicklung einer Technik zum Boosting des Trainingsdatensatzes während des Crawling-Prozesses, um die Prädiktorqualität zu verbessern
Es werden drei Arten von Zielknoten-Topologien untersucht:
- Ein dichter Zielknoten-Teilgraph
- Mehrere dichte Zielknoten-Teilgraphen
- Gleichmäßig über den Graphen verteilte Zielknoten
Die Experimente zeigen, dass GNN-basierte Ansätze, insbesondere der SAGE-Algorithmus, in allen Topologien gute Ergebnisse erzielen und oft bessere Leistung als klassische Prädiktoren wie XGB, RF, KNN und SVC aufweisen. Der Einsatz des Boosting-Verfahrens zur Vergrößerung des Trainingsdatensatzes verbessert die Performanz zusätzlich.
Stats
Die Zielknoten-Fraktion in den Datensätzen variiert zwischen 0,04% und 72%.
Der Crawling-Budget beträgt zwischen 100 und 3000 Schritte.
Quotes
"Graph neural networks are competitive to traditional classifiers and are better for individual cases."
"We develop a sample boosting technique to increase training data available during crawling which improves crawler performance."