מושגי ליבה
기존 그래프 대조 학습(GCL) 기반 커뮤니티 탐지 방법의 한계를 지적하고, 커뮤니티 구조 정보를 효과적으로 활용하는 새로운 프레임워크인 GCLS$^2$를 제안하여 커뮤니티 탐지 정확도를 향상시키는 방법을 제시한다.
תקציר
GCLS$^2$: 그래프 대조 학습과 구조 의미론을 사용한 효율적인 커뮤니티 탐지 방법
본 연구는 기존 그래프 대조 학습(GCL) 기반 커뮤니티 탐지 방법들이 노드 속성 표현 학습에만 집중하여 커뮤니티 구조의 의미론적 정보를 간과한다는 점을 지적하고, 이를 개선하기 위해 새로운 프레임워크를 제안하는 것을 목표로 한다.
본 논문에서 제안하는 GCLS$^2$ 프레임워크는 크게 세 가지 단계로 구성된다.
그래프 전처리: k-core, k-truss, k-plex와 같은 기존 커뮤니티 밀집 구조를 활용하여 원본 그래프에서 고수준 구조 그래프(GH)를 추출한다. 이때, 각 에지 쌍에 대해 특정 하위 구조 패턴의 개수를 계산하여 구조 유사도 행렬(S)을 생성한다.
구조 유사도 의미론적 인코더: 구조 유사도 행렬(S)과 속성 행렬(X)을 입력으로 받아, 2층 DNN을 사용하여 저수준 의미론적 특징(S', X')을 추출한다. 이후, 두 특징을 연결하여 GCN 인코더에 입력하여 그래프의 노드 표현(Z, ZH)을 얻는다.
구조 대조 학습: 원본 그래프(G)와 고수준 구조 그래프(GH)를 두 개의 뷰로 사용하여 구조 대조 학습을 수행한다. 고수준 구조에서 동일한 밀집 구조에 속하는 노드들을 기반으로 positive/negative 샘플 쌍을 정의하고, 이를 통해 노드의 구조적 특징 표현을 강화한다.