Centrala begrepp
本文全面概述了知識圖譜嵌入 (KGE) 技術,重點關注如何捕捉關係特性,包括複雜映射、關係模式(如對稱性、不對稱性、反演性和組合性)以及實體間的層次關係。
Sammanfattning
知識圖譜嵌入技術綜述:捕捉關係特性
導言
知識圖譜 (KGs) 以圖結構表示實體之間的關係,賦予機器理解、推理和應用知識的能力。然而,符號化的知識表示難以有效地被機器處理。知識圖譜嵌入 (KGE) 技術應運而生,將符號化的實體和關係嵌入到數值表示空間中,保留 KG 的語義和結構信息,以便於計算處理。
關係特性
KGs 的語義主要體現在關係中,這些關係具有複雜的映射特性,例如一對一、一對多、多對一和多對多,以及對稱、非對稱、反演和組合關係模式。此外,KGs 中的實體之間通常存在隱含的層次關係。準確建模這些關係特性對於 KGE 的有效性和性能至關重要。
複雜關係映射模型
克服 TransE 模型在捕捉複雜關係映射方面的局限性,當前的 KGE 模型採用了幾種創新策略:
- 基於關係感知映射的模型: TransH、TransR、STransE、TransD、TranSparse、TransF、TransA 和 TransM 等模型引入了依賴於關係的實體映射機制,例如將實體投影到關係特定的超平面或空間,以及使用不同的投影矩陣或權重來處理不同的關係類型。
- 基於特定表示空間的模型: KG2E、ManifoldE 和 TorusE 等模型將 KGs 嵌入到高斯空間、流形空間和李群等特定空間中,這些空間本身就解決了複雜關係特性的建模挑戰。
- 基於張量分解的模型: RESCAL、DistMult 和 TuckER 等模型將 KG 視為大型三階張量,並利用張量分解技術將每個三元組的分數轉換為實體和關係表示之間的雙線性運算。
- 基於神經網絡的模型: SME、NTN、ConvE、ConvKB、CapsE 和 InteractE 等模型利用非線性運算和網絡架構來捕捉實體和關係之間的交互,例如使用全連接網絡、卷積神經網絡和膠囊網絡。
多種關係模式模型
為了解決基於翻譯操作的模型(如 TransE)在建模對稱關係方面的不足,以及基於張量分解的模型(如 RESCAL)在處理非對稱關係和複雜模式(如反演和組合關係)方面的局限性,當前能夠處理多種關係模式的模型主要集中在以下幾個方面:
- 改進的張量分解模型: ComplEx、HolE 和 SimplE 等模型通過將實體和關係嵌入到複數空間、採用循環相關運算以及學習每個實體作為頭實體和尾實體的嵌入,來同時建模對稱和非對稱關係。
- 基於改進的關係感知映射的模型: PairRE 和 TripleRE 等模型通過使用配對關係嵌入和將關係表示為頭實體和尾實體的映射和轉換,來解決關係模式和複雜映射特性的聯合建模問題。
總結
本文從複雜映射特性、多種關係模式和實體間的層次關係等角度,系統地回顧和總結了當前 KGE 模型的研究現狀,並討論了相關研究的未來發展方向。