Core Concepts
실제 시나리오에 맞는 지식 그래프 완성을 위해 검증 프로세스, 마이닝 프로세스, 학습 프로세스를 통합하여 점진적 지식 그래프 완성(PKGC) 작업을 소개한다.
Abstract
이 논문은 실제 세계 시나리오에 더 부합하는 지식 그래프 완성(KGC) 작업을 제안한다. 기존의 링크 예측 및 트리플 분류 작업은 실제 상황에서 필요한 쿼리 생성 과정을 다루지 않았다. 이에 저자들은 검증 프로세스, 마이닝 프로세스, 학습 프로세스를 통합한 점진적 지식 그래프 완성(PKGC) 작업을 소개한다.
PKGC는 초기 지식 그래프를 활용하여 모델을 학습하고, 가장 유망한 사실을 식별하여 검증자에게 제안한다. 검증된 사실은 지식 그래프에 추가되며, 이 과정을 반복하여 점진적으로 지식 그래프를 완성한다.
또한 마이닝 프로세스의 효율성을 높이기 위해 최적화된 Top-k 알고리즘과 의미론적 유효성 필터를 제안한다. 실험 결과, 링크 예측 성능이 PKGC 성능을 정확히 반영하지 않음을 확인했다. 이에 PKGC 성능에 영향을 미치는 핵심 요인을 분석하고, 검증된 지식을 활용하는 증분 학습 방법을 탐구한다.
Stats
지식 그래프에는 엔티티와 관계가 지수적으로 증가하므로 모든 잠재적 사실을 저장하고 정렬하는 것이 실용적이지 않다.
제안된 최적화된 Top-k 알고리즘은 시간 복잡도를 2,000배 이상 단축할 수 있다.
Quotes
"기존 KGC 연구는 주로 트리플 분류와 링크 예측에 중점을 두었지만, 이 작업들은 실제 시나리오와 잘 부합하지 않으며 단순한 대리 벤치마크에 불과하다."
"PKGC는 점진적인 KG 완성 과정을 모방하여, 검증 프로세스, 마이닝 프로세스, 학습 프로세스를 통합한다."