Core Concepts
이벤트 시간 추론 작업에서 실제 이벤트 간 시간 관계와 모델이 학습한 편향된 관계 사이의 불일치로 인해 지식 충돌이 발생하며, 이를 완화하기 위한 대안적 데이터 생성 기법이 필요하다.
Abstract
이 논문은 이벤트 시간 추론 작업에서 발생하는 지식 충돌 문제를 다룹니다. 이벤트 시간 추론은 자연어 텍스트에 기술된 이벤트 간 시간 관계를 식별하는 것을 목표로 합니다. 그러나 실제 시간 관계와 모델이 학습한 편향된 관계 사이에 불일치가 발생하면 지식 충돌이 발생합니다.
이 논문에서는 네 가지 유형의 편향(이벤트 관계 편향, 서술 편향, 시제 편향, 의존성 편향)을 정의하고, 이를 기반으로 지식 충돌 데이터를 자동으로 선별하는 방법을 제안합니다. 또한 이러한 지식 충돌을 완화하기 위해 반사실적 데이터 증강(CDA) 기법을 소개합니다. CDA는 사전 학습 언어 모델(PLM)과 대규모 언어 모델(LLM)에 모두 적용될 수 있으며, 추가 학습 데이터 또는 in-context 학습을 위한 예시로 활용될 수 있습니다.
실험 결과, PLM과 LLM 모두 이벤트 시간 추론 작업에서 지식 충돌의 영향을 받는 것으로 나타났으며, CDA 기법이 편향 완화와 전반적인 성능 향상에 효과적인 것으로 확인되었습니다.
Stats
의사를 만나기 전에 아프게 되는 경우가 3건 있었습니다.
의사를 만난 후에 아프게 되는 경우가 8건 있었습니다.
Quotes
"이벤트 시간 추론에서, 입력에는 두 부분, 이벤트 언급과 문맥이 포함됩니다. 모델이 추론하려는 TEMPREL은 이벤트 언급 자체가 아닌 문맥에 기반해야 합니다."
"대부분의 현재 언어 모델은 문맥에 충실하지 않고 단축키를 사용하여 추론하는 경향이 있어, 이로 인해 환각이 발생합니다."