Core Concepts
대형 언어 모델(LLM)을 활용하여 도메인 특화 질문 답변 서비스를 구축할 때, 사용자 요구사항에 부합하면서도 도메인 지식을 적절히 활용할 수 있도록 모델의 선호도를 정렬하는 것이 중요하다.
Abstract
이 논문은 대형 언어 모델(LLM)을 활용하여 도메인 특화 질문 답변 서비스를 구축하는 과정에서 발생하는 두 가지 주요 문제를 해결하기 위한 방법을 제안한다.
첫째, 모델이 생성한 응답이 사용자의 요구사항에 부합하도록 하는 것이다. 이를 위해 다양한 LLM을 활용하여 스타일 선호도 집합을 구축한다.
둘째, 모델이 도메인 지식을 적절히 활용할 수 있도록 하는 것이다. 이를 위해 도메인 지식베이스에서 관련 지식을 검색하고, 이를 활용하여 지식 선호도 집합을 구축한다.
이 두 가지 선호도 집합을 활용하여 새로운 정렬 목적함수를 설계하고, 이를 통해 LLM의 선호도를 사용자 선호도와 정렬시킨다. 이를 통해 도메인 특화 질문 답변 서비스의 품질을 향상시킬 수 있다.
실험 결과, 제안한 방법인 KnowPAT이 기존 15개 baseline 방법들에 비해 우수한 성능을 보였다.
Stats
사용자 질문에 대한 정답률이 기존 방법 대비 최대 32.46% 향상되었다.
모델 기반 평가 지표인 BERTScore, 보상 점수, 퍼플렉서티 등에서도 우수한 성능을 보였다.
Quotes
"LLM 응답은 사용자 친화적이어야 하며, 부적절하거나 불친절한 내용을 생성해서는 안 된다."
"모델은 검색된 지식을 현명하게 활용할 수 있는 능력을 갖추어야 한다."