Core Concepts
이 연구는 방향성 그래프 클러스터링 문제를 통계적 관점에서 접근하여, 방향성 스토캐스틱 블록 모델(DSBM)의 최대 우도 추정을 통해 관찰된 그래프 구조에 가장 부합하는 커뮤니티 할당을 추정한다.
Abstract
이 연구는 방향성 그래프 클러스터링 문제를 통계적 관점에서 접근한다. 구체적으로 방향성 스토캐스틱 블록 모델(DSBM)의 최대 우도 추정을 통해 관찰된 그래프 구조에 가장 부합하는 커뮤니티 할당을 추정한다.
이를 위해 다음과 같은 주요 결과를 제시한다:
DSBM에 대한 최대 우도 추정 문제를 복소수 행렬 최적화 문제로 정식화하고, 이를 정규화된 유량 최적화 문제와 등가임을 보인다. 이를 통해 에지 밀도와 에지 방향성을 모두 고려하는 새로운 클러스터링 기준을 제안한다.
제안한 최대 우도 추정 문제를 효율적으로 풀기 위해 스펙트럴 클러스터링 알고리즘과 반한정 계획법 기반 클러스터링 알고리즘을 개발한다. 스펙트럴 클러스터링 알고리즘에 대해 DSBM 하에서 오분류 정점 수에 대한 이론적 상한을 제공한다.
합성 데이터와 실세계 데이터에 대한 실험을 통해 제안 알고리즘이 기존 방법들에 비해 우수한 성능을 보임을 확인한다.
Stats
방향성 그래프의 에지 밀도는 p와 q로 표현된다.
에지 방향성은 η로 표현된다.
두 커뮤니티의 크기는 각각 n1과 n2이다.
Quotes
"이 연구는 방향성 그래프 클러스터링 문제를 통계적 관점에서 접근한다."
"제안한 최대 우도 추정 문제를 효율적으로 풀기 위해 스펙트럴 클러스터링 알고리즘과 반한정 계획법 기반 클러스터링 알고리즘을 개발한다."
"스펙트럴 클러스터링 알고리즘에 대해 DSBM 하에서 오분류 정점 수에 대한 이론적 상한을 제공한다."