核心概念
知識グラフ埋め込みモデルにおいて発見された「Z-パラドックス」という問題を解決するため、Z-パラドックスに悩まされることのない新しい知識グラフ埋め込みモデルMQuinEを提案する。
摘要
本論文では、知識グラフ埋め込み(KGE)モデルにおける「Z-パラドックス」と呼ばれる問題を発見し、その問題を解決するための新しいKGEモデルMQuinEを提案している。
Z-パラドックスとは、一部の既存のKGEモデル(TransE、RotatEなど)において、ある3つの事実(h, r, e2)、(e3, r, e2)、(e3, r, t)が観測されている場合に、自動的に(h, r, t)も成立すると判断してしまう問題である。この問題は、KGEモデルの表現力に深刻な欠陥をもたらす。
提案するMQuinEモデルは、Z-パラドックスに悩まされることなく、対称/非対称、逆関係、1-N/N-1/N-N、合成関係などの複雑な関係パターンをうまくモデル化できる。理論的な分析と実験的な評価の結果、MQuinEは既存のKGEモデルに比べて大幅な性能向上を示すことが分かった。特に、Z-パラドックスの影響を受けやすい難しい事例において、MQuinEは20%以上の精度向上を達成している。
また、Z-サンプリングと呼ばれる新しいネガティブサンプリング手法を提案し、これがMQuinEの性能向上に大きく寄与することも示された。
統計資料
既存のKGEモデルでは、テストデータの35%程度がZ-パラドックスの影響を受けており、20%以上の精度低下が見られる。
MQuinEは、Z-パラドックスの影響を受けやすい難しい事例において、既存モデルに比べて10%以上の精度向上を達成した。
MQuinEは全体的にも、Hit@1で7%、Hit@10で4%の精度向上を示した。
引述
"Though popular KGE models (e.g., TransE, RotatE, OTE) have already taken various relation patterns into account, there are still limitations."
"We term this phenomenon Z-paradox due to the graph structure in Figure 1.1."
"To mitigate the negative impact of the Z-pattern, we propose a new KGE model to overcome the Z-paradox."