본 연구 논문에서는 지식 집약적인 질문 답변 작업을 위해 규칙 기반 검색 증강 생성(RuleRAG)이라는 새로운 접근 방식을 제안합니다. RuleRAG는 외부 코퍼스에서 검색된 정보를 활용하여 언어 모델의 질문 답변 성능을 향상시키는 것을 목표로 합니다.
기존의 검색 증강 생성(RAG) 프레임워크는 검색된 정보의 관련성이 부족하고 언어 모델이 검색된 콘텐츠를 효과적으로 활용하는 방법을 명확하게 알지 못한다는 한계점을 가지고 있습니다.
RuleRAG는 이러한 문제를 해결하기 위해 기호 규칙을 명시적으로 도입하여 검색 및 생성 프로세스를 안내합니다.
RuleRAG는 규칙을 사용하여 검색 단계에서 검색어와 논리적으로 관련된 문서를 검색합니다. 규칙은 검색어와 관련된 다양한 검색 논리를 나타내며, 각 규칙에 따라 검색을 수행하여 검색 결과의 정확도를 높입니다.
RuleRAG는 검색된 문서와 규칙을 함께 언어 모델에 입력하여 답변 생성을 안내합니다. 규칙은 언어 모델이 검색된 정보를 효과적으로 활용하여 답변을 생성하도록 돕는 역할을 합니다.
RuleRAG는 규칙을 활용하는 두 가지 학습 방법을 제안합니다.
RuleRAG-ICL은 규칙을 검색어와 함께 언어 모델에 입력하여 컨텍스트 내 학습을 수행합니다. 이를 통해 언어 모델은 규칙을 이해하고 규칙에 따라 답변을 생성하는 방법을 학습합니다.
RuleRAG-FT는 규칙 기반 미세 조정(RGFT)을 통해 검색 및 생성 모델을 추가로 학습시킵니다. RGFT는 규칙을 사용하여 검색 모델이 관련성이 높은 문서를 검색하도록 하고 생성 모델이 규칙에 따라 답변을 생성하도록 안내합니다.
본 논문에서는 5개의 규칙 인식 질문 답변 벤치마크를 구축하여 RuleRAG의 성능을 평가했습니다. 실험 결과, RuleRAG-ICL은 기존 RAG 프레임워크보다 성능이 우수하며 RuleRAG-FT는 RuleRAG-ICL보다 더욱 뛰어난 성능을 보였습니다.
RuleRAG는 규칙을 활용하여 검색 및 생성 프로세스를 안내함으로써 지식 집약적인 질문 답변 작업에서 기존 RAG 프레임워크의 성능을 크게 향상시킵니다. RuleRAG는 다양한 유형의 검색 및 생성 모델에 적용 가능하며 규칙을 사용하여 언어 모델의 추론 능력을 향상시킬 수 있습니다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問