Core Concepts
知識グラフ埋め込み手法の性能を事前に評価できる信頼性指標 ReliKを提案する。ReliKは埋め込み手法や下流タスクに依存せず、知識グラフの特定の部分に対する性能を予測できる。
Abstract
本論文では、知識グラフ埋め込み手法(KGE)の性能を事前に評価できる新しい指標 ReliKを提案している。
ReliKの特徴は以下の通り:
KGE手法に依存せず、埋め込みのスコアのランキングに基づいて算出される
KGEの再学習を必要とせず、効率的に計算できる
下流タスクに依存せず、様々なタスクに適用可能
知識グラフの特定の部分に対する性能を予測できる(局所性を持つ)
ReliKの計算方法は以下の通り:
対象の三つ組(head, relation, tail)に対して、headとtailの近傍の負例三つ組を集める
対象の三つ組のスコアを、近傍の負例三つ組のスコアと比較してランキングを算出
headとtailのランキングの逆数の平均をReliKとする
ReliKは、三つ組分類、関係予測、クエリ応答、ルール抽出などの下流タスクの性能と高い相関を示すことを実験的に示している。また、近似計算手法を提案し、正確な計算と比べて高速かつ精度の良い結果が得られることを示している。
Stats
対象の三つ組のスコアが、近傍の負例三つ組のスコアよりも高い割合が高いほど、ReliKの値が高くなる
対象の三つ組のスコアが、近傍の負例三つ組のスコアよりも低い割合が高いほど、ReliKの値が低くなる
Quotes
"Can we assess a priori how well a knowledge graph embedding will perform on a specific downstream task and in a specific part of the knowledge graph?"
"ReliK relies solely on KGE embedding scores, is task- and KGE-agnostic, and requires no further KGE training."
"ReliK correlates well with both common downstream tasks, such as tail or relation prediction and triple classification, as well as advanced downstream tasks, such as rule mining and question answering, while preserving locality."