核心概念
실제 대응 관계가 없는 엔티티(dangling entities)를 포함한 상황에서 효과적으로 엔티티를 정렬하는 방법을 제안한다.
要約
이 논문은 실제 대응 관계가 없는 엔티티(dangling entities)를 포함한 상황에서 엔티티 정렬 문제를 다룬다.
- 기존 엔티티 정렬 방법들은 대응 관계가 있는 엔티티 쌍만을 고려하지만, 실제로는 대응 관계가 없는 엔티티들이 존재할 수 있다.
- 이러한 dangling 엔티티들이 존재하면 기존 방법들의 성능이 크게 저하된다.
- 저자들은 dangling 엔티티 탐지와 엔티티 정렬을 동시에 수행하는 새로운 프레임워크를 제안한다.
- 엔티티-관계 주의 메커니즘을 통해 dangling 엔티티의 영향을 줄이고, positive-unlabeled 학습 손실 함수를 통해 dangling 엔티티를 효과적으로 탐지한다.
- 실험 결과, 제안 방법이 dangling 엔티티를 고려하지 않는 기존 방법들보다 우수한 성능을 보이며, dangling 엔티티를 고려하는 기존 방법들과도 견줄만한 성능을 보인다.
統計
대부분의 기존 엔티티 정렬 방법들은 dangling 엔티티가 존재할 때 성능이 크게 저하된다.
예를 들어, BootEA의 경우 DBP15KZH-EN 데이터셋에서 Hits@1 성능이 31.30%에서 20.96%로 떨어졌다.
제안 방법은 dangling 엔티티를 고려하지 않는 방법들보다 우수한 성능을 보였다. 예를 들어, GA16K 데이터셋에서 Hits@1 성능이 67.59%로 가장 높았다.
引用
"The presence of dangling entities in the candidate entity set, on the one hand, leads to more unnecessary query burden and, on the other hand, increases the possibility of getting the wrong alignment."
"Dangling entities essentially break the one-to-one mapping assumption commonly held by the current EA methods, thus rendering many methods ineffective."