核心概念
본 연구는 그래프 링크 예측을 위해 다단계 부정적 샘플링 전략을 제안한다. 제안 모델 DMNS는 조건부 확산 모델을 활용하여 쿼리 노드에 대한 다양한 수준의 부정적 샘플을 생성하고, 이를 통해 강력한 노드 표현을 학습한다.
摘要
본 연구는 그래프 링크 예측을 위한 새로운 접근법인 DMNS를 제안한다. DMNS는 조건부 확산 모델을 활용하여 쿼리 노드에 대한 다단계 부정적 샘플을 생성한다.
- 기존 부정적 샘플링 방법은 사전 정의된 휴리스틱 또는 적대적 생성 기법을 사용하여 부정적 샘플을 선택하지만, 이는 유연성이 부족하고 어려운 샘플을 제어하기 어렵다는 한계가 있다.
- DMNS는 확산 모델을 활용하여 쿼리 노드에 대한 다단계 부정적 샘플을 생성한다. 확산 모델의 마르코프 체인 특성을 활용하여 다양한 수준의 어려운 샘플을 유연하게 생성할 수 있다.
- 이렇게 생성된 부정적 샘플을 활용하여 강력한 노드 표현을 학습할 수 있다. 이론적 분석을 통해 DMNS가 부정적 샘플의 분포가 긍정적 샘플의 분포와 부차선형 상관관계를 가짐을 보였다.
- 다양한 벤치마크 데이터셋에 대한 실험 결과, DMNS가 기존 방법들에 비해 우수한 링크 예측 성능을 보였다.
統計資料
그래프 데이터셋의 노드 수, 간선 수, 특징 차원 등의 통계 정보는 다음과 같다:
Cora: 노드 2,708개, 간선 5,429개, 특징 1,433차원
Citeseer: 노드 3,327개, 간선 4,732개, 특징 3,703차원
Coauthor-CS: 노드 18,333개, 간선 163,788개, 특징 6,805차원
Actor: 노드 7,600개, 간선 30,019개, 특징 932차원