核心概念
본 논문은 모듈러리티와 코사인 함수를 활용한 두 가지 겹치는 커뮤니티 탐지 알고리즘을 제안한다. 이 알고리즘들은 무방향 및 방향 그래프 구조에 적용 가능하며, 실제 데이터를 활용한 실험을 통해 효과성과 타당성을 입증한다.
摘要
이 논문은 네트워크 커뮤니티 탐지 문제에 대해 다룬다. 대부분의 기존 방법은 노드가 하나의 커뮤니티에만 속한다고 가정하지만, 실제로는 노드가 여러 커뮤니티에 동시에 속할 수 있다.
이 논문에서는 두 단계 접근법을 사용하여 겹치는 커뮤니티를 탐지하는 두 가지 알고리즘을 제안한다:
- 모듈러리티 기반 알고리즘:
- 기존 모듈러리티 함수를 확장하여 노드가 커뮤니티에 속할 수 있는 기준을 유연하게 조정할 수 있는 새로운 모듈러리티 함수를 정의한다.
- 무방향 그래프와 방향 그래프 모두에 적용 가능하며, 방향 그래프의 경우 정상 분포를 활용한 모듈러리티 함수를 제안한다.
- 코사인 기반 알고리즘:
- 각 노드를 벡터로 표현하고, 클러스터의 중심 벡터와의 코사인 유사도가 일정 수준 이상이면 해당 노드가 클러스터에 속한다고 판단한다.
- 무방향 그래프와 방향 그래프 모두에 적용 가능하다.
실험 결과, 제안한 알고리즘들이 기존 알고리즘에 비해 우수한 성능을 보였다. 특히 모듈러리티 기반 알고리즘이 가장 좋은 결과를 나타냈다.
统计
무방향 그래프의 경우, 노드 u와 커뮤니티 Cj 사이의 에지 수가 θ배 이상 커뮤니티 Cj의 총 차수보다 크면 노드 u가 커뮤니티 Cj에 속한다.
방향 그래프의 경우, 노드 u에서 커뮤니티 Cj로의 에지 수와 커뮤니티 Cj에서 노드 u로의 에지 수의 합이 2θ배 이상 커뮤니티 Cj 내 모든 노드의 정상 분포 곱의 합보다 크면 노드 u가 커뮤니티 Cj에 속한다.
引用
"두 단계 접근법을 사용하여 겹치는 커뮤니티를 탐지하는 두 가지 알고리즘을 제안한다."
"모듈러리티 기반 알고리즘은 기존 모듈러리티 함수를 확장하여 노드가 커뮤니티에 속할 수 있는 기준을 유연하게 조정할 수 있다."
"코사인 기반 알고리즘은 각 노드를 벡터로 표현하고, 클러스터의 중심 벡터와의 코사인 유사도가 일정 수준 이상이면 해당 노드가 클러스터에 속한다고 판단한다."