Core Concepts
グラフニューラルネットワークベースの協調フィルタリングモデルにおいて、特徴量の過剰相関が性能低下の主要因となっていることを明らかにし、特徴量の非相関化を通じて過剰相関と過剰平滑化の両問題を同時に解決する新しい枠組みを提案する。
Abstract
本論文は、グラフニューラルネットワーク(GNN)ベースの協調フィルタリング(CF)モデルにおける特徴量の過剰相関問題に着目している。従来のGNN-based CFモデルでは、多層のメッセージ伝播により、ユーザーとアイテムの表現が過度に類似してしまう「過剰平滑化」の問題が指摘されてきた。しかし、本論文では、特徴量間の過剰相関も重要な問題であると指摘し、その影響を理論的に分析している。
具体的には以下の通り:
実験的に、GNN-based CFモデルにおいて特徴量の過剰相関と過剰平滑化が広く存在し、モデルの性能低下につながることを示した。
理論的に、特徴量の過剰相関と過剰平滑化の間に密接な関係があることを明らかにした。
上記の洞察に基づき、適応的な特徴量非相関化手法(AFDGCF)を提案した。これは、各GNNレイヤーの出力表現に対して動的に相関ペナルティを適用することで、過剰相関と過剰平滑化の両問題を同時に緩和する。
4つの公開データセットと4つの代表的なGNN-based CFモデルを用いた実験により、提案手法の有効性を検証した。結果、提案手法は既存手法に比べて推薦精度を大幅に向上させることができた。
Stats
ユーザー数は6,040、アイテム数は3,629、相互作用数は836,478、密度は3.8e-2である。
ユーザー数は26,752、アイテム数は19,857、相互作用数は1,001,901、密度は1.8e-3である。
ユーザー数は29,859、アイテム数は40,989、相互作用数は1,027,464、密度は8.4e-4である。
ユーザー数は58,145、アイテム数は58,052、相互作用数は2,517,437、密度は7.5e-4である。