Core Concepts
대화형 질의 응답 시스템에서 사용자의 정보 요구를 효과적으로 이해하고 관련 정보를 검색하기 위해, 대형 언어 모델(LLM)의 지식과 추론 능력을 활용하여 다중 질의를 생성하고 이를 통해 검색 성능을 향상시킬 수 있다.
Abstract
이 논문은 대화형 질의 응답 시스템에서 사용자의 정보 요구를 효과적으로 이해하고 관련 정보를 검색하는 방법을 제안한다. 기존 방식은 사용자 질의를 단일 질의로 재작성하여 검색하는 반면, 이 논문에서는 대형 언어 모델(LLM)의 지식과 추론 능력을 활용하여 다중 질의를 생성하고 이를 통해 검색 성능을 향상시키는 방법을 제안한다.
구체적으로 다음과 같은 접근법을 제안한다:
AD(Answer-Driven) 모델: LLM이 생성한 답변을 단일 질의로 사용하여 검색
QD(Query-Driven) 모델: LLM에게 직접 다중 질의를 생성하도록 요청
AQD(Answer-Query-Driven) 모델: LLM이 먼저 답변을 생성한 후 이를 바탕으로 다중 질의를 생성
AQDA(Answer-Query-Driven with Answer-based Reranking) 모델: AQD 모델에 추가로 LLM이 생성한 답변을 기반으로 최종 검색 결과를 재순위화
실험 결과, 제안 모델들이 기존 방식에 비해 우수한 성능을 보였으며, 특히 AQD와 AQDA 모델이 가장 좋은 성능을 나타냈다. 이는 LLM의 지식과 추론 능력을 활용하여 다중 질의를 생성하는 것이 효과적임을 보여준다.
Stats
트렌토와 NYU 사이의 이동 거리는 66마일이다.
트렌토와 Columbia University 사이의 이동 거리는 77마일이다.
트렌토와 Rutgers University 사이의 이동 거리는 39마일이다.
Quotes
"대화형 정보 검색(CIS)은 대화형 지식 보조 시스템 개발에 초점을 맞추는 정보 검색(IR)의 주요 분야이다."
"기존 접근법은 사용자의 정보 요구를 단일 질의로 모델링하지만, 이는 여러 사실을 연쇄적으로 추론해야 하는 복잡한 질의에 적합하지 않다."
"우리는 LLM의 지식과 추론 능력을 활용하여 다중 질의를 생성함으로써 검색 성능을 향상시킬 수 있다."