المفاهيم الأساسية
본 논문에서는 순수 메시지 전달 방식을 사용하여 그래프 신경망(GNN)에서 링크 예측에 중요한 공통 이웃(CN)과 같은 구조적 특징을 효과적으로 추정할 수 있음을 보여줍니다.
الملخص
순수 메시지 전달을 통한 링크 예측을 위한 공통 이웃 추정 연구 논문 요약
참고문헌: Kaiwen Dong, Zhichun Guo, Nitesh V. Chawla. Pure Message Passing Can Estimate Common Neighbor for Link Prediction. 38th Conference on Neural Information Processing Systems (NeurIPS 2024).
본 연구는 그래프 표현 학습에서 우수한 성능을 보이는 메시지 전달 신경망(MPNN)을 링크 예측 작업에 적용할 때, 공통 이웃(CN)과 같은 간단한 휴리스틱 방법보다 항상 우수한 성능을 보이지 않는다는 점에 주목합니다. 이러한 문제를 해결하기 위해 순수 메시지 전달 방식을 통해 링크 예측에 필수적인 CN과 같은 공동 구조적 특징을 효과적으로 추정할 수 있는지 탐구합니다.
본 연구에서는 입력 벡터의 직교성을 활용하여 순수 메시지 전달이 공동 구조적 특징을 포착할 수 있음을 제시합니다. 구체적으로, MPNN이 CN 휴리스틱을 근사하는 데 얼마나 능숙한지 연구하고, 그 결과를 바탕으로 새로운 링크 예측 모델인 메시지 전달 링크 예측기(MPLP)를 제안합니다. MPLP는 준직교 벡터를 활용하여 링크 레벨 구조적 특징을 추정하는 동시에 노드 레벨 복잡성을 유지합니다.
MPLP의 주요 특징
준직교 벡터(QO 벡터) 기반 구조적 특징 추정: 높은 차원의 선형 공간에서 무작위로 샘플링된 벡터는 거의 직교하는 경향이 있다는 점을 활용합니다. 메시지 전달을 통해 이러한 QO 벡터를 전파하고 내적을 사용하여 노드 쌍의 공동 구조적 정보를 추정합니다.
노드 라벨 추정: 단순히 CN을 세는 것만으로는 로컬 이웃에 내장된 다양한 토폴로지 구조를 포괄할 수 없다는 점을 고려하여, 거리 인코딩(DE)을 사용하여 대상 노드 쌍을 기준으로 최단 경로 거리에 따라 노드에 레이블을 지정합니다.
바로 가기 제거: 학습 데이터에서 대상 노드 쌍이 기존 링크를 나타내는 양의 인스턴스를 나타내는 경우, 특정 노드가 더 가까운 대상 노드와 대상 노드 간의 링크를 더 먼 노드로 가는 지름길로 활용할 수 있습니다. 이로 인해 학습 및 테스트 단계 간에 분포 불일치가 발생하여 모델의 일반화 기능이 저하될 수 있습니다. 이를 방지하기 위해 각 학습 배치 동안 원래 그래프에서 대상 링크를 제외합니다.
특징 통합: 구조적 특징을 얻은 후, 대상 노드 쌍 (u, v)에 대한 포괄적인 링크 표현을 공식화하고, 이를 분류기에 입력하여 노드 (u, v) 간의 링크 예측을 수행합니다.