Core Concepts
대화 응답 생성 모델의 모순 응답을 효과적으로 완화하기 위해서는 대규모의 모순 응답 데이터가 필요하다. 이 연구에서는 처음으로 다양한 대화 응답 생성 모델의 모순 응답을 대규모로 수집하고, 이를 분석하여 모순 응답의 특성을 파악하였다. 또한 이 데이터셋을 활용하여 모순 응답 탐지 성능을 크게 향상시킬 수 있음을 보였다.
Abstract
이 연구는 대화 응답 생성 모델(RGM)의 모순 응답을 효과적으로 완화하기 위한 방법을 제안한다.
대규모의 RGM 생성 모순 응답 데이터셋 구축:
다양한 고성능 RGM을 활용하여 10,000개의 모순 응답과 17,000개의 비모순 응답을 수집하였다.
이는 기존 연구에 비해 매우 큰 규모의 데이터셋이다.
RGM 모순 응답의 특성 분석:
RGM 모순 응답에는 두 가지 특징이 두드러졌다.
응답 내부의 모순성: 하나의 응답 내에서 상충되는 정보가 포함되는 경우
모호한 표현: 모순 여부 판단이 애매모호한 표현이 사용되는 경우
이러한 특징은 사람이 작성한 모순 응답에서는 잘 나타나지 않았다.
모순 응답 탐지기 성능 향상:
본 데이터셋을 활용하여 모순 응답 탐지기를 학습시킨 결과, 기존 탐지기 대비 성능이 크게 향상되었다.
특히 RGM 모순 응답의 특징을 잘 포착할 수 있었다.
이는 대규모 RGM 모순 응답 데이터의 중요성을 보여준다.
Stats
모순 응답 내부에 상충되는 정보가 포함된 경우가 전체 모순 응답의 8% 이상 존재했다.
사람이 작성한 모순 응답에서는 이러한 내부 모순성이 전혀 관찰되지 않았다.
Quotes
"Mitigating the generation of contradictory re-
sponses poses a substantial challenge in dia-
logue response generation."
"Nevertheless, no attempt has been made to build an
extensive collection of model-generated con-
tradictory responses."