Core Concepts
대규모 언어 모델을 활용하여 기업 지식 베이스에 대한 질문 답변 성능을 향상시키는 방법을 제안한다.
Abstract
이 논문은 기업 지식 베이스에 대한 질문 답변 성능을 향상시키기 위해 대규모 언어 모델(LLM)을 활용하는 EKRG 프레임워크를 제안한다.
검색 모듈에서는 LLM을 활용하여 문서-질문 쌍을 생성하고, 관련성 인식 교사-학생 학습 전략을 통해 검색기 학습 효율을 높인다. 생성 모듈에서는 CoT(Chain-of-Thought) 기반 미세 조정 방법을 통해 LLM 기반 생성기가 검색된 문서를 활용하여 사용자 질문에 효과적으로 답변할 수 있도록 한다.
실험 결과, 제안 방법이 다양한 공개 데이터셋과 실제 기업 지식 베이스에서 검색 및 생성 성능을 크게 향상시킴을 보여준다. 특히 CoT 기반 미세 조정이 솔루션 지향 질문 답변에 효과적임을 확인했다.
Stats
기업 지식 베이스에는 291,649개의 문서가 포함되어 있다.
질문 답변 테스트 데이터셋에는 사실 지향 질문 1,386개, 솔루션 지향 질문(짧은 답변) 167개, 솔루션 지향 질문(긴 답변) 234개가 포함되어 있다.
Quotes
"최근 생성 자연어 처리 기술의 급속한 발전으로 사용자 질문에 대한 정확하고 일관된 답변을 생성하는 것이 가능해졌다."
"기업 지식 베이스의 경우 개인정보 보호 및 보안 정책으로 인해 질문 검색 및 생성을 위한 광범위한 학습 데이터를 구축하기가 어려운 과제이다."