核心概念
サブポピュレーションシフトの中で、属性付きグラフ上の新規カテゴリーに属するノードを効率的に検出する手法を提案する。
摘要
本研究では、サブポピュレーションシフトの中で属性付きグラフ上の新規カテゴリーに属するノードを検出する手法RECO-SLIPを提案している。
まず、ソースドメインの全てのノードは既存のカテゴリーに属し、ターゲットドメインにはそれらの既存カテゴリーに加えて新規カテゴリーが出現するという設定を考える。ソースとターゲットの間でカテゴリーの相対的な割合が変化するサブポピュレーションシフトが起こる。
RECO-SLIPは以下の2つの要素から構成される:
再現率制約最適化: ソースドメインでの偽陽性率を最小化しつつ、ターゲットドメインでの再現率を一定以上に保つ制約付き最適化問題を解くことで、サブポピュレーションシフトに対する堅牢性を高める。
選択的リンク予測: ターゲットドメインの中で分類器が低い確信度を示すノードに着目し、それらの間のリンク予測損失を最小化することで、新規カテゴリーに属するノードの表現を効果的に分離する。
提案手法RECO-SLIPは、標準的なPU学習手法、プロペンシティ重み付け手法、グラフPU学習手法と比較して、5つのデータセットにおいて優れた性能を示している。また、選択的リンク予測の有効性や、サブポピュレーションシフトの強度に対する堅牢性も確認された。
統計資料
新規カテゴリーに属するノードの割合は、Cora-Sで0.129、CiteSeer-Sで0.246、Computers-Sで0.034、Photo-Sで0.072、arxivで0.051である。