Core Concepts
대규모 그래프 데이터에 대한 준지도 노드 분류 문제를 해결하기 위해 그래프 학습 레이어와 이중 그래프 합성곱 레이어를 결합한 새로운 신경망 모델을 제안한다.
Abstract
이 논문에서는 그래프 학습 이중 그래프 합성곱 신경망(GLDGCN)을 제안한다. GLDGCN은 기존 메시지 전달 그래프 합성곱 신경망에 이중 합성곱 레이어와 그래프 학습 레이어를 추가하여 설계되었다.
GLDGCN의 주요 특징은 다음과 같다:
그래프 학습 레이어를 통해 입력 데이터의 그래프 구조를 자동으로 학습할 수 있다. 이를 통해 그래프 구조가 주어지지 않은 일반 데이터에도 적용할 수 있다.
이중 합성곱 레이어를 통해 인접행렬 정보와 PPMI 행렬 정보를 모두 활용하여 그래프 특징을 더욱 포괄적으로 추출할 수 있다.
준지도 노드 분류 실험에서 기존 방법들보다 우수한 성능을 보였다.
또한 대규모 그래프 데이터에 대한 GLDGCN의 한계를 극복하기 위해 서브그래프 클러스터링 기술과 확률적 경사하강법을 도입한 클러스터 GCN 알고리즘을 제안하였다. 이를 통해 PPI 데이터셋(50,000개 이상의 노드)과 Reddit 데이터셋(200,000개 이상의 노드)에서도 우수한 성능을 보였다.
Stats
그래프 데이터의 노드 수가 많을수록 GPU 메모리 요구량이 급격히 증가하여 학습이 어려워진다.
클러스터 GCN 알고리즘을 통해 메모리 요구량을 크게 줄일 수 있었다.
클러스터 GCN은 깊은 신경망 구조에서도 우수한 분류 성능을 보였다.
Quotes
"대규모 그래프 데이터에 대한 GLDGCN의 한계를 극복하기 위해 서브그래프 클러스터링 기술과 확률적 경사하강법을 도입한 클러스터 GCN 알고리즘을 제안하였다."
"클러스터 GCN 알고리즘을 통해 메모리 요구량을 크게 줄일 수 있었다."
"클러스터 GCN은 깊은 신경망 구조에서도 우수한 분류 성능을 보였다."