核心概念
本文提出了一種新的知識圖譜編碼器,它在關係圖卷積網絡(R-GCN)的聚合函數中採用張量分解,以增強實體和關係信息的整合。我們的模型通過使用低秩張量定義的投影矩陣來增強鄰近實體的表示,這有助於多任務學習,從而產生關係感知的表示。此外,我們引入了一種通過CP分解對核心張量進行低秩估計的技術,這有效地壓縮和正則化了我們的模型。我們採用啟發自對比學習的訓練策略,這緩解了處理巨大圖譜時1-N方法固有的訓練限制。我們在兩個常見的基準數據集FB15k-237和WN18RR上超越了所有競爭對手,同時使用了低維度的實體和關係嵌入。
摘要
本文提出了一種新的知識圖譜編碼器TGCN,它結合了張量分解和關係圖卷積網絡(R-GCN)的優點。
- 聚合函數:
- TGCN在R-GCN的聚合函數中採用了張量分解,以增強實體和關係信息的整合。
- 具體來說,TGCN使用低秩張量定義的投影矩陣來轉換鄰近實體的表示,這有助於多任務學習,產生關係感知的表示。
- 模型壓縮:
- 為了解決高維嵌入帶來的可擴展性問題,TGCN使用CP分解對核心張量進行低秩近似,有效地壓縮和正則化了模型。
- 訓練策略:
- TGCN採用啟發自對比學習的訓練策略,緩解了1-N方法在處理巨大圖譜時的訓練限制。
- 實驗結果:
- TGCN在FB15k-237和WN18RR基準數據集上均優於所有競爭對手,同時使用了低維度的實體和關係嵌入。
- TGCN還顯著提升了簡單解碼器DistMult在FB15k-237上的性能。
總的來說,TGCN通過有效整合實體和關係信息,以及採用創新的模型壓縮和訓練策略,成為一種高效的知識圖譜編碼器。
統計資料
知識圖譜通常包含大量實體和關係類型,因此知識圖譜嵌入模型必須具有可擴展性。
高維嵌入會導致可擴展性問題,TGCN使用低維嵌入仍能取得優秀的性能。
引述
"我們提出了一種新的一般知識圖譜編碼器,它利用張量分解來鼓勵知識傳播。這是通過關係依賴的轉換來實現參數共享,從而實現鄰域信息的高效聚合。"
"我們採用CP分解來對我們模型的核心張量進行低秩近似,以降低其可訓練參數數量並對其進行正則化。此外,受對比學習方法的啟發,我們使用一種圖大小不變的目標函數來訓練我們的模型,以緩解處理巨大圖譜時的訓練限制。"