REAR는 검색된 문서의 관련성을 정확하게 평가하고, 관련성 신호를 활용하여 노이즈가 있는 문서의 영향을 줄여 질문 답변 성능을 향상시키는 프레임워크입니다.
본 논문에서는 외부 코퍼스에서 검색된 정보를 활용하여 언어 모델의 질문 답변 성능을 향상시키는 새로운 규칙 기반 검색 증강 생성(RuleRAG) 프레임워크를 제안합니다. RuleRAG는 기호 규칙을 활용하여 검색 단계에서 논리적으로 관련된 문서를 검색하고 생성 단계에서 검색된 정보를 효과적으로 활용하도록 언어 모델을 안내합니다.
LongRAG는 긴 맥락 질문 답변(LCQA) 작업에서 기존 검색 기반 생성(RAG) 모델의 한계를 해결하기 위해 전역 정보 추출기와 CoT 기반 필터를 활용하는 새로운 RAG 시스템 패러다임입니다.
대규모 언어 모델(LLM)의 질문 답변 성능을 향상시키기 위해, 문서 내 문단 간의 관계 정보를 그래프 신경망(GNN)을 사용하여 학습하고 이를 검색 시스템에 통합하는 방법을 제시합니다.
본 논문에서는 텍스트 지식 그래프(TKG)에서 복잡한 추론이 필요한 질문 답변을 위해 특별히 설계된 새로운 데이터셋인 RiTeK를 소개합니다. RiTeK는 의료 분야에 중점을 두고 있으며, 다양한 토폴로지 구조, 관계 유형, 엔터티 유형, 그리고 관계형 및 텍스트 정보를 통합하는 쿼리를 제공하여 TKG에서 정교한 추론을 요구합니다. 또한, 본 논문에서는 텍스트 지식 그래프에서 복잡한 추론 경로 검색을 위해 Monte Carlo Tree Search (MCTS)를 적용한 새로운 방법인 Relational MCTS를 제안하고 그 효과를 검증합니다.
본 논문에서는 다양한 도메인에서 수집된 장문 답변을 바탕으로 RAG-QA 시스템의 성능을 평가하기 위한 새로운 데이터셋인 LFRQA와 모델 기반 평가 프레임워크인 RAG-QA 아레나를 제안합니다.