Core Concepts
대화 시스템의 모순 응답 생성을 완화하기 위해서는 대규모의 모순 응답 데이터가 필요하다. 이를 통해 모순 응답의 특성을 이해하고 데이터 기반 방법을 개선할 수 있다.
Abstract
이 논문은 대화 시스템의 모순 응답 문제를 해결하기 위해 대규모 모순 응답 데이터셋을 구축했다.
먼저, 대화 문맥에 대한 후속 질문을 활용하여 다양한 대화 모델이 생성한 모순 응답을 수집했다. 수집된 데이터에 대한 분석을 통해 모순 응답의 특성을 파악했다.
모순 응답 탐지기를 학습할 때 이 데이터셋을 활용하면 기존 방식보다 성능이 크게 향상됨을 보였다. 이는 모순 응답 데이터의 확보가 모순 완화 기술 개발에 매우 중요함을 시사한다.
Stats
모순 응답 생성 모델들은 자신의 이전 발화와 모순되는 내용을 포함하는 경우가 많다.
모순 응답에는 모호한 표현이 자주 포함되어 있어, 사람들 간에 모순 여부에 대한 판단이 엇갈리는 경우가 많다.
Quotes
"Mitigating the generation of contradictory responses poses a substantial challenge in dialogue response generation."
"Nevertheless, no attempt has been made to build an extensive collection of model-generated contradictory responses."