핵심 개념
본 연구는 모듈러리티와 코사인 함수를 활용한 두 가지 겹치는 커뮤니티 탐지 알고리즘을 제안하고, 실제 데이터를 통해 알고리즘의 효과성을 검증하였다.
초록
이 논문은 네트워크 커뮤니티 탐지 문제에 대해 다루고 있다. 대부분의 기존 방법은 노드가 하나의 커뮤니티에만 속한다고 가정하지만, 실제로는 노드가 여러 커뮤니티에 동시에 속하는 경우가 많다.
저자들은 두 단계 접근법을 사용하여 겹치는 커뮤니티를 탐지하는 두 가지 알고리즘을 제안하였다:
- 파라미터화된 모듈러리티 겹치는 커뮤니티 탐지 알고리즘:
- 노드가 커뮤니티에 속하기 위해서는 해당 커뮤니티와의 연결 정도가 기대값보다 충분히 커야 한다는 기준을 사용한다.
- 이때 기대값은 파라미터 θ에 의해 조절된다.
- 코사인 겹치는 커뮤니티 탐지 알고리즘:
- 각 노드를 벡터로 표현하고, 커뮤니티 중심 벡터와의 코사인 유사도가 일정 수준 이상이면 해당 노드를 커뮤니티에 포함시킨다.
저자들은 실제 데이터와 합성 데이터를 활용하여 제안 알고리즘의 성능을 검증하였다. 실험 결과, 제안 알고리즘이 기존 알고리즘에 비해 우수한 성능을 보였다.
통계
네트워크의 노드 수 N은 400~10,000 사이의 값을 가진다.
평균 차수 k는 6~30 사이의 값을 가진다.
최대 차수 maxk는 8~50 사이의 값을 가진다.
겹치는 노드 수 on은 20~300 사이의 값을 가진다.
겹치는 커뮤니티 수 om은 2~5 사이의 값을 가진다.
인용구
"대부분의 커뮤니티 탐지 방법은 노드가 하나의 커뮤니티에만 속한다고 가정하지만, 실제로는 노드가 여러 커뮤니티에 동시에 속하는 경우가 많다."
"본 연구는 모듈러리티와 코사인 함수를 활용한 두 가지 겹치는 커뮤니티 탐지 알고리즘을 제안하였다."