Core Concepts
CORE는 정보 병목 현상 원리를 활용하여 그래프에서 노이즈와 잘못된 정보를 제거하고 누락된 정보를 복구함으로써 링크 예측 모델의 일반화 성능을 향상시킨다.
Abstract
이 논문은 링크 예측 문제에 대한 새로운 데이터 증강 기법인 CORE를 제안한다. CORE는 두 단계로 구성된다:
-
Complete 단계: 누락된 링크를 복구하기 위해 그래프에 높은 확률의 링크를 추가한다. 이를 통해 그래프 구조 정보를 보완한다.
-
Reduce 단계: 정보 병목 현상 원리를 활용하여 노이즈와 불필요한 링크를 제거한다. 이를 통해 링크 예측에 핵심적인 그래프 구조만을 보존한다.
CORE는 각 링크에 대해 독립적인 데이터 증강을 수행함으로써 링크 간 상호 의존성 문제를 해결한다. 실험 결과, CORE는 다양한 벤치마크 데이터셋에서 기존 방법 대비 우수한 성능을 보였으며, 특히 노이즈가 많은 환경에서 강건성이 높은 것으로 나타났다. 또한 CORE는 단순 휴리스틱 링크 예측 모델의 성능도 향상시킬 수 있음을 보였다.
Stats
그래프 데이터의 불완전성과 노이즈로 인해 링크 예측 모델의 일반화 성능이 저하될 수 있다.
데이터 증강 기법은 이러한 문제를 해결할 수 있는 방법이지만, 기존 그래프 데이터 증강 기법은 주로 노드 및 그래프 분류 문제에 초점을 맞추고 있다.
링크 예측 문제에서는 링크 간 상호 의존성으로 인해 데이터 증강이 어려운 문제가 있다.
Quotes
"Link prediction (LP) is a fundamental task in graph representation learning, with numerous applications in diverse domains. However, the generalizability of LP models is often compromised due to the presence of noisy or spurious information in graphs and the inherent incompleteness of graph data."
"To mitigate the degradation of model performance on noisy data with inferior data quality, data augmentation (DA) has emerged as a powerful technique by artificially expanding the training dataset with transformed versions of the original data instances, primarily in the field of computer vision [29, 41]. However, in the context of LP, few works have been proposed to overcome the limitation of models on noisy graphs [67]."