핵심 개념
부분적으로 관찰된 그래프의 모듈러리티는 실제 그래프의 모듈러리티와 유사하게 유지된다. 충분한 수의 간선이 관찰되는 경우, 부분적으로 관찰된 그래프의 모듈러리티가 실제 그래프의 모듈러리티와 유사할 가능성이 높다.
초록
이 논문은 부분적으로 관찰된 그래프의 모듈러리티 특성을 분석한다.
주요 내용은 다음과 같다:
-
실제 그래프 G가 높은 모듈러리티를 가지는 경우, 부분적으로 관찰된 그래프 G'도 높은 모듈러리티를 가질 가능성이 높다. 이는 G'에서 관찰된 간선 수가 충분히 많은 경우에 성립한다.
-
반대로, 실제 그래프 G가 낮은 모듈러리티를 가지는 경우, G'도 낮은 모듈러리티를 가질 가능성이 높다. 이는 G'의 평균 차수가 충분히 크면 성립한다.
-
부분적으로 관찰된 그래프 G'의 최적 분할을 찾는 것이 실제 그래프 G의 최적 분할을 찾는데 도움이 될 수 있다.
-
밀도가 높은 그래프의 경우 일정 수의 정점만 샘플링해도 모듈러리티를 잘 추정할 수 있지만, 간선 수가 2차 미만인 그래프에서는 그렇지 않다.
통계
실제 그래프 G의 간선 수가 e(G)일 때, 부분적으로 관찰된 그래프 Gp의 기대 간선 수는 e(G)p이다.
실제 그래프 G의 정점 수가 v(G)일 때, 부분적으로 관찰된 그래프 Gp의 기대 평균 차수는 2e(G)p/v(G)이다.
인용구
"If G has high modularity, is the observed graph G′ likely to have high modularity? We see that this is indeed the case under a mild condition, in a natural model where we test edges at random."
"Further, under this stronger condition, finding a good partition for G′ helps us to find a good partition for G."