Die Studie untersucht das Problem der gerichteten Graphenclusterung aus statistischer Sicht. Dabei wird die Clusterung als Schätzung der zugrundeliegenden Gemeinschaften im gerichteten stochastischen Blockmodell (DSBM) formuliert. Die Autoren führen die Maximum-Likelihood-Schätzung (MLE) auf dem DSBM durch, um die wahrscheinlichste Gemeinschaftszuordnung basierend auf der beobachteten Graphenstruktur zu bestimmen.
Darüber hinaus zeigen die Autoren, dass diese MLE-Formulierung äquivalent zu einem neuartigen (regularisierten) Flussoptimierungsansatz ist, der sowohl die Kantendichte als auch die Kantenausrichtung berücksichtigt. Basierend auf diesem theoretischen Rahmen führen die Autoren zwei neue Algorithmen für die gerichtete Clusterung ein: einen Spektral-Clustering-Algorithmus und einen Semidefinite-Programming-basierten Clustering-Algorithmus.
Für den Spektral-Clustering-Algorithmus liefern die Autoren auch eine theoretische Obergrenze für die Anzahl der falsch zugeordneten Knoten unter Verwendung von Methoden aus der Matrixstörungstheorie. Die Leistungsfähigkeit der vorgeschlagenen Algorithmen wird sowohl auf synthetischen als auch auf realen Datensätzen im Vergleich zu bestehenden Methoden evaluiert.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Mihai Cucuri... às arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19516.pdfPerguntas Mais Profundas