Core Concepts
대형 언어 모델의 질문 답변 성능을 향상시키기 위해 검색 결과를 효과적으로 통합하는 방법을 제안한다.
Abstract
이 논문은 대형 언어 모델(LLM)과 검색 기반 기술을 통합하여 개방 도메인 질문 답변 성능을 향상시키는 방법을 탐구한다.
먼저 단일 라운드 접근법을 살펴본다. 단순 concatenation 방식은 "unknown" 응답을 많이 생성하는 문제가 있다. 반면 각 검색 결과를 개별적으로 LLM에 입력하고 다수결로 최종 답변을 선택하는 Post-Fusion 방식은 "unknown" 응답은 줄이지만 정답이 다수결에 포함되지 않는 문제가 있다.
이를 해결하기 위해 두 가지 다중 라운드 접근법을 제안한다. 첫째, Concat + PF는 초기에 concatenation 방식으로 답변을 생성하고, "unknown" 응답이 나오면 Post-Fusion으로 재시도한다. 둘째, PF + Concat은 초기에 Post-Fusion으로 답변 후보를 생성하고, 이를 바탕으로 concatenation 방식으로 최종 답변을 도출한다.
실험 결과, 제안한 다중 라운드 접근법이 단일 라운드 방식보다 10% 이상 성능이 향상되었다. 또한 토큰 사용량 분석을 통해 Concat + PF가 자원 효율적이면서도 우수한 성능을 보임을 확인했다.
Stats
"LLM이 "unknown" 응답을 생성하는 비율은 concatenation 방식에서 20% 정도였다."
"다수결 투표 방식에서 정답이 포함되어 있지만 다수가 선택하지 않는 경우가 5-20% 정도 발생했다."
Quotes
"대형 언어 모델(LLM)은 제한된 지식 표현으로 인해 개방 도메인 질문 답변에서 부정확성과 구체성 부족을 겪는다."
"검색 기반 기술과 LLM의 통합은 더 정확하고 상세한 응답을 제공할 수 있는 유망한 해결책으로 부상했다."