이 논문은 지식 그래프 엔티티 유형 지정(KGET) 작업을 다룬다. KGET 작업은 지식 그래프에서 엔티티의 누락된 유형 주석을 예측하는 것을 목표로 한다.
저자들은 기존 연구들이 엔티티의 국소 이웃 구조 지식만을 활용하고 엔티티, 관계, 유형의 텍스트 표현에 담긴 의미론적 지식을 간과했다고 지적한다. 또한 의미론적 지식과 구조적 지식의 상호작용을 활용하여 거짓 음성 문제를 해결할 수 있다고 주장한다.
이를 위해 저자들은 SSET(Semantic and Structure-aware KG Entity Typing) 프레임워크를 제안한다. SSET은 3개의 모듈로 구성된다:
의미론적 지식 인코딩 모듈(SEM): 마스크된 엔티티 유형 예측 작업을 통해 지식 그래프의 사실적 지식을 PLM에 주입한다.
구조적 지식 집계 모듈(SKA): 엔티티의 1-hop 이웃, 다중 hop 이웃, 알려진 유형을 활용하여 누락된 유형을 예측한다.
비지도 유형 재순위화 모듈(UTR): SEM과 SKA 모듈의 예측 결과를 활용하여 거짓 음성 문제를 완화하고 최종 유형 예측을 생성한다.
실험 결과, SSET은 기존 최신 방법들을 크게 능가하는 성능을 보였다. 특히 희소 그래프 구조를 가진 YAGO43kET 데이터셋에서 두드러진 성능 향상을 보였다. 이는 텍스트 의미론 활용의 중요성을 보여준다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Muzhi Li,Min... ב- arxiv.org 04-15-2024
https://arxiv.org/pdf/2404.08313.pdfשאלות מעמיקות