核心概念
ノードの表現と関係性を組み合わせることで、従来のモデルよりも優れたリンク予測性能を実現する。さらに、グラフの不完全性に対処するための介入手法を提案し、性能をさらに向上させる。
摘要
本論文では、ノードの表現と関係性を組み合わせたリンク予測モデルを提案している。従来のモデルは、ノードの表現のみを使用していたため、ペアワイズの関係性を捉えられないという問題があった。そこで本論文では、ノードの表現とペアワイズの関係性を組み合わせた「Neural Common Neighbor (NCN)」モデルを提案する。NCNは、ノードの表現をMPNNで学習し、ペアワイズの関係性を共通ネイバーの表現の和として表現する。
さらに、グラフの不完全性が性能に与える影響を分析し、2つの介入手法を提案する。1つ目は「Common Neighbor Completion (CNC)」で、未観測のリンクを予測モデルで補完する。2つ目は「Target Link Removal (TLR)」で、予測対象のリンクを入力グラフから除去する。これらの介入手法を組み合わせた「Neural Common Neighbor with Completion (NCNC)」は、従来手法を大きく上回る性能を達成している。
统计
共通ネイバーの数が少ないほど、トレーニングデータとテストデータの分布にずれが生じる
共通ネイバーの数が減少すると、従来手法の性能が大幅に低下する
引用
"MPNN will produce exactly equal representations for node v2, v3 as they are symmetric in the graph. So GAE will produce the same prediction for two links (v1, v2) and (v1, v3). However, their pairwise relations are different."
"Incompleteness of input graph is ubiquitous for link prediction, as the task itself is to predict unobserved edges which do not exist in the input graph."