이 논문은 제로샷 대화 상태 추적(DST) 문제를 해결하기 위한 새로운 방법을 제안한다. 기존의 제로샷 DST 방법은 전이 학습만을 적용하고 대상 도메인의 레이블 없는 데이터를 활용하지 않았다.
이 연구에서는 공동 학습과 자기 학습 방법을 통해 이러한 레이블 없는 데이터를 활용한다. 주 과제와 보조 과제를 설계하여 상호 보완적으로 학습하며, 이를 통해 대상 도메인의 미지의 슬롯 유형을 생성하고 양질의 샘플을 선별할 수 있다. 또한 자동 레이블 생성을 통해 DST 모델의 학습과 미세 조정을 최적화한다.
실험 결과, 이 방법은 일반 언어 모델에서 제로샷 시나리오의 평균 조인트 목표 정확도를 8% 향상시켰다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Chuang Li,Ya... alle arxiv.org 04-04-2024
https://arxiv.org/pdf/2310.10492.pdfDomande più approfondite