Kernkonzepte
대규모 언어 모델(LLM)의 환각 및 오래된 지식과 같은 문제를 해결하기 위해 외부 데이터베이스를 활용하는 검색 증강 생성(RAG)에서, 다양한 출처의 신뢰도를 고려하지 않는 기존 RAG 시스템의 한계를 지적하고, 출처 신뢰도를 추정하고 이를 검색 및 정보 통합 과정에 통합하는 새로운 RAG 프레임워크인 RA-RAG를 제안한다.
Zusammenfassung
검색 증강 생성에서 출처 신뢰도 추정의 중요성
본 논문은 검색 증강 생성(Retrieval-Augmented Generation, RAG) 시스템에서 출처 신뢰도 추정의 중요성을 다룬 연구 논문입니다. RAG는 대규모 언어 모델(LLM)의 환각 현상과 오래된 지식 문제를 해결하기 위해 외부 데이터베이스를 활용하는 기술입니다. 하지만 기존 RAG 시스템은 데이터베이스 내 출처의 신뢰도를 고려하지 않고 단순히 질문과의 관련성만을 기반으로 문서를 검색하기 때문에, 신뢰할 수 없는 출처의 정보를 그대로 가져와 잘못된 답변을 생성할 위험이 있습니다.
본 연구는 다양한 출처의 신뢰도를 고려하여 RAG 시스템의 성능을 향상시키는 것을 목표로 합니다.
본 논문에서는 출처 신뢰도를 추정하고 이를 검색 및 정보 통합 과정에 통합하는 새로운 RAG 프레임워크인 **RA-RAG (Reliability-Aware RAG)**를 제안합니다. RA-RAG는 다음과 같은 두 단계로 작동합니다.
1단계: 반복적 신뢰도 추정
정답 레이블 없이 주어진 질문 세트에 대해 각 출처의 신뢰도를 추정합니다.
먼저 모든 출처의 가중치를 동일하게 설정하고, 각 질문에 대한 답변을 생성합니다.
생성된 답변과 실제 답변을 비교하여 각 출처의 신뢰도를 업데이트합니다.
이 과정을 반복하여 출처 신뢰도를 점진적으로 개선합니다.
2단계: 신뢰할 수 있고 효율적인 추론
추정된 출처 신뢰도를 기반으로 문서를 검색하고 정보를 효과적으로 통합합니다.
모든 출처에서 문서를 검색하는 대신, 신뢰도가 높은 출처를 우선적으로 선택하여 검색합니다.
선택된 출처에서 검색된 문서를 사용하여 가중 다수결 투표(Weighted Majority Voting, WMV)를 통해 최종 답변을 생성합니다.