מושגי ליבה
본 논문에서는 맥락적 밴딧과 PageRank를 결합한 링크 예측을 위한 새로운 융합 알고리즘인 PRB(PageRank Bandits)를 제안합니다. PRB는 맥락적 밴딧의 활용 및 탐색 균형과 PageRank의 그래프 구조 활용을 결합하여 링크 예측의 정확도를 향상시킵니다.
개요
본 연구는 추천 시스템, 지식 그래프 완성 등 다양한 분야에서 중요한 과제인 링크 예측 문제를 다룹니다. 기존의 지도 학습 기반 링크 예측 방법은 시간에 따라 변화하는 사용자 관심사에 적응하고 링크 예측에서 활용과 탐색의 딜레마를 해결하는 데 어려움을 겪었습니다. 이 연구에서는 링크 예측을 각 링크 예측 상호 작용이 순차적으로 발생하는 순차적 의사 결정 프로세스로 재구성하고, 맥락적 밴딧과 PageRank를 결합한 새로운 융합 알고리즘인 PRB(PageRank Bandits)를 제안합니다.
주요 연구 내용
문제 정의 및 알고리즘: 링크 예측 작업을 맥락적 밴딧 프레임워크 아래에서 순차적 의사 결정으로 공식화하고, 각 상호 작용을 하나의 의사 결정 라운드로 간주합니다. 이 의사 결정 프로세스의 성능을 평가하기 위해 pseudo-regret 메트릭을 도입합니다. PRB는 맥락적 밴딧의 활용 및 탐색 균형과 PageRank의 그래프 구조 활용을 결합하여 협업적 활용 및 탐색을 구현합니다. 맥락적 밴딧 접근 방식과 비교하여 PRB는 집계된 표현을 위해 그래프 연결성을 활용합니다. PageRank와 달리 맥락적 밴딧의 활용 및 탐색 원칙을 통합하여 협업적 균형을 달성합니다. 또한 노드 분류에서 링크 예측으로의 새로운 변환을 도입하여 PRB를 노드 분류로 확장합니다.
이론적 분석: 노드 맥락과 그래프 연결성 모두에서 보상으로의 매핑을 나타내는 새로운 보상 함수 공식을 도입합니다. 제안된 알고리즘의 링크 예측 성능에 대한 이론적 보장을 제공하여 PRB에 의해 유도된 누적 regret이 라운드 수에 따라 선형적으로 증가하지 않음을 보여줍니다. 또한 이 regret의 상한은 보상과 감쇠 계수 간의 관계와 신경망 함수 클래스의 필요한 실현 복잡성에 대한 통찰력을 제공합니다.
실험 평가: 온라인 및 오프라인 설정에서 PRB를 광범위하게 평가하여 밴딧 기반 및 그래프 기반 방법과 비교합니다. 온라인 링크 예측에서는 각 링크 예측이 순차적으로 이루어지며, 각 라운드에서 주어진 서비스 노드에 대해 모델은 서비스 노드와 링크를 형성할 가능성이 가장 높은 대상 노드를 선택해야 합니다. 그런 다음 모델은 피드백을 관찰하고 해당 최적화를 수행합니다. 목표는 T 라운드(예: T = 10,000)에 대한 regret을 최소화하는 것입니다. PRB는 순차적 의사 결정을 위해 설계된 최첨단 밴딧 기반 접근 방식(예: [76, 12])보다 훨씬 뛰어난 성능을 보여 협업적 활용 및 탐색을 위해 맥락적 밴딧과 PageRank를 융합하는 데 성공했음을 보여줍니다. 오프라인 링크 예측에서는 훈련 및 테스트 데이터가 모두 제공되며 일반적인 지도 학습 프로세스를 따릅니다. PRB는 온라인 학습을 위해 설계되었지만 훈련 데이터에 대한 오프라인 학습에도 직접 적용할 수 있습니다. 그런 다음 훈련된 모델을 사용하여 테스트 데이터에 대한 링크 예측을 수행하고 최첨단 GNN 기반 방법(예: [18, 61])과 비교합니다. PRB의 우수한 성능은 원칙적인 활용 및 탐색이 링크 예측의 성능 병목 현상을 해결할 수 있음을 나타냅니다. 또한 PRB에 대한 포괄적인 평가를 위해 ablation 및 민감도 연구를 수행합니다.
결론
본 연구는 맥락적 밴딧과 PageRank를 결합한 링크 예측을 위한 새로운 융합 알고리즘인 PRB를 제안합니다. PRB는 맥락적 밴딧의 활용 및 탐색 균형과 PageRank의 그래프 구조 활용을 결합하여 링크 예측의 정확도를 향상시킵니다. 이론적 분석과 실험 평가를 통해 PRB의 우수한 성능을 입증했습니다.
סטטיסטיקה
PRB는 MovieLens 데이터셋에서 EE-Net보다 14% 이상 낮은 regret을 달성했습니다.
PRB는 Cora, Citeseer, Pubmed 데이터셋에서 NeuralTS보다 각각 3.0%, 1.2%, 3.5%의 regret 감소를 보였습니다.
PRB는 6개의 오프라인 링크 예측 벤치마크 데이터셋에서 최신 방법인 NCNC보다 평균 2.42% 향상된 성능을 보였습니다.