核心概念
本文提出了一種新的知識圖譜嵌入方法DECAL,能夠在退化克利福德代數中進行嵌入,從而捕捉更複雜的關係模式。
摘要
本文提出了一種新的知識圖譜嵌入方法DECAL,能夠在退化克利福德代數中進行嵌入。與之前的方法不同,DECAL不再假設底層的二次型必須是非退化的,而是允許存在退化的基向量。這使得DECAL能夠泛化到基於雙數的方法,並捕捉實體和關係嵌入中實部和虛部之間缺乏高階交互的模式。
文章設計了兩種新的模型來發現參數p、q和r的最佳值。第一種方法是貪婪搜索,第二種方法是基於神經網絡的向量空間預測。
實驗結果表明,允許退化基向量確實有助於獲得更好的嵌入。與現有最先進方法相比,DECAL在所有數據集上都表現更出色,特別是在驗證集上的平均倒數排名(MRR)指標上。文章還證明,貪婪搜索就足以發現接近最優的p、q和r值。
統計資料
在WN18-RR數據集上,DECAL+GSDC的MRR達到0.296,優於所有其他方法。
在UMLS數據集上,DECAL+LES的MRR達到0.883,優於所有其他方法。
在KINSHIP數據集上,DECAL+GSDC、DECAL+GS和KECI的MRR均達到0.743,優於其他方法。
在NELL-995-h100數據集上,DECAL+GSDC的MRR達到0.270,優於KECI 6個百分點。
在FB15k-237數據集上,DECAL+GSDC的MRR達到0.241,平均優於其他方法40%。
引述
"我們提出考慮具有二階幂等性的幂等基向量。在這些空間中,表示為Clp,q,r,允許推廣基於雙數的方法(無法使用Clp,q建模)並捕捉實體和關係嵌入中實部和虛部之間缺乏高階交互的模式。"
"實驗結果表明,允許退化基向量確實有助於獲得更好的嵌入。與現有最先進方法相比,DECAL在所有數據集上都表現更出色,特別是在驗證集上的平均倒數排名(MRR)指標上。"