핵심 개념
다양한 근접 거리의 이벤트 쌍에 대한 시간적 단서를 통합하여 모든 유형의 시간 데이터셋에서 성능을 향상시킨다.
초록
이 논문은 이벤트 시간 관계 추출(ETRE)이라는 중요하지만 까다로운 문제를 다룹니다. 이벤트 쌍은 텍스트 내에서 다양한 거리에 위치하며, 이를 근접 거리 대역이라고 합니다. 근접 거리 대역이 더 먼(즉, "긴") 또는 더 가까운(즉, "짧은") 이벤트 쌍의 시간적 순서는 다르게 인코딩됩니다. 최신 ETRE 모델은 짧거나 긴 근접 거리 대역의 이벤트에 대해서는 잘 수행하지만, 둘 다에 대해서는 그렇지 않습니다. 그러나 실제 세계의 자연 텍스트에는 모든 유형의 시간 이벤트 쌍이 포함되어 있습니다.
이 논문에서는 MulCo: 다중 스케일 대조 지식 공동 증류를 제안합니다. 이는 다양한 이벤트 쌍 근접 거리 대역에 걸쳐 지식을 공유하여 모든 유형의 시간 데이터셋에서 성능을 향상시키는 융합 접근 방식입니다. 실험 결과, MulCo는 짧은 거리와 긴 거리 근접 거리 대역에 걸친 시간적 추론 언어적 단서를 성공적으로 통합하고 여러 ETRE 벤치마크 데이터셋에서 새로운 최신 기술 수준의 결과를 달성했습니다.
통계
실제 세계의 자연 텍스트에는 모든 유형의 시간 이벤트 쌍이 포함되어 있다.
최신 ETRE 모델은 짧거나 긴 근접 거리 대역의 이벤트에 대해서는 잘 수행하지만, 둘 다에 대해서는 그렇지 않다.
BERT 기반 문맥 임베딩은 짧은 거리 언어적 단서에 의존하는 NLP 작업에 적합하지만, 문서 구조와 같은 장거리 문서 속성을 감지하는 데 어려움이 있다.
GNN 모델은 더 광범위하고 장거리 구조적 단서를 포착하여 문서 전체에 걸친 시간 인코딩 방식을 더 잘 포착할 수 있다.
인용구
"실제 세계의 자연 텍스트에는 모든 유형의 시간 이벤트 쌍이 포함되어 있습니다."
"최신 ETRE 모델은 짧거나 긴 근접 거리 대역의 이벤트에 대해서는 잘 수행하지만, 둘 다에 대해서는 그렇지 않습니다."
"BERT 기반 문맥 임베딩은 짧은 거리 언어적 단서에 의존하는 NLP 작업에 적합하지만, 문서 구조와 같은 장거리 문서 속성을 감지하는 데 어려움이 있습니다."