Khái niệm cốt lõi
대화 상태 추적을 위해 대화 요약을 활용하여 효과적이고 효율적인 대화 검색 방법을 제안한다.
Tóm tắt
이 논문은 대화 상태 추적(Dialogue State Tracking, DST)을 위한 효과적이고 효율적인 대화 검색 방법을 제안한다.
기존 연구에서는 대화 내용 자체를 검색 키와 쿼리로 사용하고, 주석이 달린 대화 데이터로 검색기를 fine-tuning하여 성능을 높였다.
그러나 이 방법은 새로운 도메인이나 언어로 확장하기 어려운 문제가 있다.
이 논문에서는 대화 요약을 검색 키와 쿼리로 사용하는 방법을 제안한다.
대화 요약기로 대화 내용을 요약하여 검색 키와 쿼리를 생성하고, 이를 활용하여 효과적인 최대 내적 검색을 수행한다.
대화 요약기 사용으로 인한 추가 비용을 줄이기 위해, 대화 요약과 유사한 벡터 표현을 생성하는 경량 대화 인코더를 제안한다.
MultiWOZ 데이터셋에서 실험한 결과, 제안 방법이 관련 baseline 대비 적은 수의 주석 대화 데이터로도 우수한 성능을 보였다.
Thống kê
대화 상태 추적을 위해 최소한의 주석 대화 데이터(100개)로도 우수한 성능을 보였다.
제안 방법은 기존 방법 대비 대화 상태 추적 정확도(JGA)와 F1 점수가 크게 향상되었다.
Trích dẫn
"Few-shot dialogue state tracking (DST) with Large Language Models (LLM) relies on an effective and efficient conversation retriever to find similar in-context examples for prompt learning."
"To address this problem, we handle the task of conversation retrieval based on text summaries of the conversations."
"To avoid the extra inference cost brought by LLM-based conversation summarization, we further distill a light-weight conversation encoder which produces query embeddings without decoding summaries for test conversations."