이 논문은 대화 시스템에서 참여자의 주도권 정보를 활용하여 적절한 응답을 생성하는 방법을 제안한다. 기존 대화 시스템은 주도권 정보를 고려하지 않고 전체적인 응답 생성 모델을 학습하였기 때문에, 주도권이 혼재된 응답을 생성하는 문제가 있었다.
제안된 모델 IDPT는 주도권 정보를 별도의 접두사 매개변수로 분리하여 관리한다. 이를 통해 주도권에 따른 응답 생성이 가능하다. IDPT는 두 가지 버전으로 구현되는데, 하나는 주도권 레이블이 있는 감독 학습 환경에서 사용되고(IDPT-HA), 다른 하나는 주도권 레이블이 없는 비감독 학습 환경에서 사용된다(IDPT-SA).
실험 결과, IDPT는 자동 평가 지표와 사람 평가에서 기존 방법들을 뛰어넘는 성능을 보였다. 또한 IDPT는 주도권을 조작하여 적절한 응답을 생성할 수 있음을 보였다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Yuxiang Nie,... klo arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17636.pdfSyvällisempiä Kysymyksiä