이 논문은 대형 언어 모델(LLM)과 검색 기반 기술을 통합하여 개방 도메인 질문 답변 성능을 향상시키는 방법을 탐구한다.
먼저 단일 라운드 접근법을 살펴본다. 단순 concatenation 방식은 "unknown" 응답을 많이 생성하는 문제가 있다. 반면 각 검색 결과를 개별적으로 LLM에 입력하고 다수결로 최종 답변을 선택하는 Post-Fusion 방식은 "unknown" 응답은 줄이지만 정답이 다수결에 포함되지 않는 문제가 있다.
이를 해결하기 위해 두 가지 다중 라운드 접근법을 제안한다. 첫째, Concat + PF는 초기에 concatenation 방식으로 답변을 생성하고, "unknown" 응답이 나오면 Post-Fusion으로 재시도한다. 둘째, PF + Concat은 초기에 Post-Fusion으로 답변 후보를 생성하고, 이를 바탕으로 concatenation 방식으로 최종 답변을 도출한다.
실험 결과, 제안한 다중 라운드 접근법이 단일 라운드 방식보다 10% 이상 성능이 향상되었다. 또한 토큰 사용량 분석을 통해 Concat + PF가 자원 효율적이면서도 우수한 성능을 보임을 확인했다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询