이 논문은 대화 응답 선택을 위한 새로운 사후 학습 방법인 Dial-MAE를 소개한다. Dial-MAE는 대화 문맥 임베딩을 사용하여 응답을 생성하는 비대칭 인코더-디코더 구조를 사용한다. 이를 통해 대화 문맥과 응답 간의 특징 정렬을 달성할 수 있다. 실험 결과, Dial-MAE는 두 개의 일반적인 벤치마크에서 최신 성능을 달성했으며, 기존 방법보다 빠른 응답 속도를 보였다. 저자들은 Dial-MAE의 효과성을 입증하기 위해 다양한 실험을 수행했다. 첫째, Dial-MAE는 단순한 MLM 사후 학습보다 월등한 성능을 보였다. 둘째, 비대칭 마스킹 전략과 디코더 레이어 수가 Dial-MAE의 성능에 중요한 역할을 한다는 것을 확인했다. 셋째, Dial-MAE는 다른 밀집 모델보다 대화 응답 선택에 더 적합한 것으로 나타났다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Zhenpeng Su,... alle arxiv.org 03-26-2024
https://arxiv.org/pdf/2306.04357.pdfDomande più approfondite