이 논문은 사건 공지 해결(Event Coreference Resolution, ECR)을 다룬다. ECR은 동일한 실제 사건을 나타내는 사건 클러스터를 연결하는 작업이다. 저자들은 대형 언어 모델(LLM)에서 생성된 자유 텍스트 근거(FTR)를 활용하여 ECR 성능을 향상시키는 방법을 제안한다.
FTR 생성: 저자들은 LLaMA 2-7B-Chat 모델을 사용하여 사건 공지 쌍에 대한 FTR을 생성한다. FTR은 사건 공지 간 관계에 대한 추론 과정을 모방한다.
근거 지향 사건 클러스터링(ROEC): 저자들은 학생 모델의 잠재 공간에서 사건 쌍과 해당 FTR을 정렬하는 ROEC 기법을 구현한다. 이를 통해 클러스터 수준 정보를 인코딩한다.
사건 공지 지식 증류: 최적화된 학생 모델을 사용하여 사건 공지 쌍의 공지 확률을 학습한다. 이때 교사 모델의 FTR 표현을 활용하여 추가 감독 신호를 제공한다.
저자들은 ECB+, GVC, AIDA Phase 1 데이터셋에서 실험을 수행했으며, 기존 최신 기법을 능가하는 성능을 달성했다. 또한 근거 생성과 활용이 사건 공지 해결에 유용한 정보를 제공한다는 것을 보였다.
翻譯成其他語言
從原文內容
arxiv.org
從以下內容提煉的關鍵洞見
by Abhijnan Nat... 於 arxiv.org 04-05-2024
https://arxiv.org/pdf/2404.03196.pdf深入探究