Core Concepts
대화 시스템의 모순 응답 생성을 완화하기 위해서는 대규모의 모순 응답 데이터가 필요하다. 이를 통해 모순 응답의 특성을 이해하고 데이터 기반 모순 완화 기법을 향상시킬 수 있다.
Abstract
이 논문은 대화 시스템의 모순 응답 생성 문제를 해결하기 위해 대규모 모순 응답 데이터셋을 구축했다.
대화 문맥 준비: 후속 질문(FQ)을 활용하여 모순 응답을 유발할 수 있는 대화 문맥을 수집했다.
모델 응답 수집: 8개의 고성능 대화 모델을 활용하여 수집된 문맥에 대한 응답을 생성했다.
모델 응답 주석: 3명의 작업자가 각 응답의 일관성을 판단하여 모순/비모순 응답을 레이블링했다.
이렇게 구축된 대규모 데이터셋을 분석한 결과, 모델 응답의 내부 모순과 모호한 표현이 모순 응답의 주요 특징으로 나타났다. 또한 이 데이터셋을 활용하여 학습한 모순 탐지기가 기존 방식보다 우수한 성능을 보였다.
Stats
모순 응답의 경우 내부적으로 모순된 정보가 포함되어 있는 경우가 많다.
8개 모델 중 7개 모델에서 내부 모순 응답이 전체 모순 응답의 8% 이상 관찰되었다.
사람이 작성한 모순 응답에서는 이러한 내부 모순이 관찰되지 않았다.
Quotes
"RGMs do not generate contradictions exclusively to FQs; hence, addressing all contradiction types solely by examining the contradictions to FQs is impractical."
"Nevertheless, we believe that refining contradiction suppression techniques using contradictory responses to these representative inputs can establish the groundwork for attempts to mitigate contradictions in a broader input range."