Core Concepts
문서 수준 관계 추출 성능 향상을 위해 그래프 합성곱 신경망과 증거 검색 기반 주의 집중 메커니즘을 결합한 GEGA 모델을 제안한다.
Abstract
이 논문은 문서 수준 관계 추출(DocRE) 문제를 해결하기 위해 GEGA라는 새로운 모델을 제안한다. GEGA는 그래프 합성곱 신경망(GCN)과 증거 검색 기반 주의 집중 메커니즘을 결합하여 구현되었다.
주요 내용은 다음과 같다:
- 관계 추출을 위해 관련성이 높은 증거 문장을 선별하기 위해 GCN을 활용하여 다중 가중치 행렬을 구축한다.
- 다중 스케일 표현 집계를 통해 증거 검색 성능을 향상시킨다.
- 완전 지도 학습과 약 지도 학습 방식을 모두 활용하여 모델을 학습한다.
실험 결과, GEGA는 DocRED, Re-DocRED, Revisit-DocRED 데이터셋에서 기존 최신 모델 대비 성능 향상을 보였다. 특히 증거 문장 기반 평가 지표인 Evi-F1에서 두드러진 성과를 보였다.
Stats
문서 내 개체 간 관계를 예측하기 위해서는 대부분의 개체 쌍에 대해 관계가 없다는 점에서 상당한 불필요한 메모리 오버헤드가 발생한다.
기존 방법들은 문서 전체 정보를 활용하지만, 실제로는 관계 추출에 필요한 것은 일부 증거 문장들이다.
증거 문장 정보가 없는 데이터셋에서는 증거 검색(ER) 과정을 통해 전체 문서에서 증거 문장 목록을 얻어야 한다.
Quotes
"문서 수준 관계 추출(DocRE)은 문서 텍스트에서 개체 간 관계를 추출하는 것을 목표로 한다. 문장 수준 관계 추출과 비교하면, 더 복잡한 의미 이해가 필요하다."
"현재 일부 연구에서는 증거 문장 내 논리 규칙을 활용하여 DocRE 성능을 향상시키고 있다. 그러나 증거 문장이 제공되지 않는 데이터에서는 연구자들이 전체 문서에서 증거 문장 목록을 얻어야 한다."