Core Concepts
지식 그래프 임베딩 모델에서 유사한 개체가 실제로 유사한 임베딩을 가지는지 여부를 실험적으로 분석하고, 이를 통해 임베딩 공간 내 유사성과 지식 그래프 내 유사성 간의 관계를 규명한다.
Abstract
이 연구는 지식 그래프 임베딩 모델(KGEM)에서 유사한 개체가 실제로 유사한 임베딩을 가지는지 여부를 실험적으로 분석한다.
주요 내용은 다음과 같다:
지식 그래프 내 개체 유사성을 측정하기 위해 1-hop 및 2-hop 서브그래프 기반의 Jaccard 유사도를 사용한다.
임베딩 공간 내 유사성은 코사인 유사도로 측정한다.
두 유사성 간의 관계를 Rank-Biased Overlap(RBO) 지표로 분석한다.
다양한 KGEM 모델을 대상으로 실험을 수행하며, 모델 간 유사성 개념의 차이를 분석한다.
순위 기반 지표(MRR, Hits@K)와 RBO 간의 상관관계를 분석한다.
개체 유사성 학습에 중요한 술어(predicate)를 모델별로 분석한다.
실험 결과, KGEM 모델마다 지식 그래프 내 개체 유사성과 임베딩 공간 내 유사성 간의 관계가 상당히 다르게 나타났다. 또한 순위 기반 지표와 RBO 간의 상관관계도 모델마다 큰 차이를 보였다. 이는 KGEM 모델이 개체 유사성을 학습하는 방식이 상이하며, 순위 기반 지표만으로는 이를 적절히 평가할 수 없음을 시사한다. 마지막으로 모델별로 개체 유사성 학습에 중요한 술어 집합이 다르게 나타났다.
Stats
KGEM 모델의 순위 기반 지표(MRR, Hits@K)와 RBO 간의 상관관계는 다음과 같다:
MRR과 RBO@10(1-hop) 간 상관관계가 매우 높음
MRR과 RBO@100(1-hop) 간 상관관계가 크게 낮아짐
MRR과 RBO@K(2-hop)의 상관관계는 K가 커질수록 높아짐