핵심 개념
개방형 질문 답변 과제에서 문서 검색 기술과 대규모 언어 모델을 결합하여 정보적이고 상황에 맞는 답변을 생성하는 새로운 접근법을 제안한다.
초록
이 논문은 개방형 질문 답변 과제에서 문서 검색 기술과 대규모 언어 모델을 결합한 새로운 접근법인 생성기-검색기-생성기(GRG) 방식을 제안한다.
- 문서 생성: 대규모 언어 모델(InstructGPT)을 사용하여 질문에 기반한 상황적으로 풍부한 문서를 생성한다.
- 문서 검색: 이중 인코더 네트워크를 활용하여 외부 문서 집합에서 관련 문서를 검색한다.
- 답변 생성: 생성된 문서와 검색된 문서를 두 번째 대규모 언어 모델에 입력하여 최종 답변을 생성한다.
실험 결과, GRG 접근법은 TriviaQA, WebQ, NQ 데이터셋에서 기존 최신 모델들을 능가하는 성능을 보였다. 생성된 문서와 검색된 문서를 결합함으로써 정보적이고 상황에 맞는 답변을 생성할 수 있음을 입증했다.
통계
질문에 대한 답변을 생성하기 위해서는 광범위한 문서 집합에 대한 접근이 필요하다.
기존 방식의 한계는 고정 크기의 문서 조각을 사용하여 관련성 없는 정보가 포함될 수 있다는 것이다.
질문과 문서의 독립적인 처리로 인해 질문과 문서 간의 상호작용을 충분히 활용하지 못한다.
인용구
"기존 방식은 고정 크기의 문서 조각을 사용하여 관련성 없는 정보가 포함될 수 있다."
"질문과 문서의 독립적인 처리로 인해 질문과 문서 간의 상호작용을 충분히 활용하지 못한다."