Die Studie untersucht das Problem der gerichteten Graphenclusterung aus statistischer Sicht. Dabei wird die Clusterung als Schätzung der zugrundeliegenden Gemeinschaften im gerichteten stochastischen Blockmodell (DSBM) formuliert. Die Autoren führen die Maximum-Likelihood-Schätzung (MLE) auf dem DSBM durch, um die wahrscheinlichste Gemeinschaftszuordnung basierend auf der beobachteten Graphenstruktur zu bestimmen.
Darüber hinaus zeigen die Autoren, dass diese MLE-Formulierung äquivalent zu einem neuartigen (regularisierten) Flussoptimierungsansatz ist, der sowohl die Kantendichte als auch die Kantenausrichtung berücksichtigt. Basierend auf diesem theoretischen Rahmen führen die Autoren zwei neue Algorithmen für die gerichtete Clusterung ein: einen Spektral-Clustering-Algorithmus und einen Semidefinite-Programming-basierten Clustering-Algorithmus.
Für den Spektral-Clustering-Algorithmus liefern die Autoren auch eine theoretische Obergrenze für die Anzahl der falsch zugeordneten Knoten unter Verwendung von Methoden aus der Matrixstörungstheorie. Die Leistungsfähigkeit der vorgeschlagenen Algorithmen wird sowohl auf synthetischen als auch auf realen Datensätzen im Vergleich zu bestehenden Methoden evaluiert.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Mihai Cucuri... a las arxiv.org 03-29-2024
https://arxiv.org/pdf/2403.19516.pdfConsultas más profundas