Grunnleggende konsepter
REAR는 검색된 문서의 관련성을 정확하게 평가하고, 관련성 신호를 활용하여 노이즈가 있는 문서의 영향을 줄여 질문 답변 성능을 향상시키는 프레임워크입니다.
Sammendrag
REAR: 오픈 도메인 질문 답변을 위한 관련성 인식 검색 증강 프레임워크
본 논문은 대규모 언어 모델(LLM) 기반 오픈 도메인 질문 답변 시스템에서 검색된 문서의 관련성을 정확하게 평가하고 활용하는 방법을 제시합니다.
REAR(Relevance-Aware Retrieval-augmented generation) 프레임워크는 LLM에 명시적인 평가 모듈을 통합하여 관련성 인식 기능을 강화합니다.
REAR 아키텍처는 세 단계로 구성됩니다.
관련성 평가: 검색된 문서의 관련성 정도를 평가합니다. LLM을 사용하여 쿼리-문서 쌍을 관련성 임베딩으로 매핑하고, 이를 선형 투영 계층으로 구현된 평가 모듈을 통해 점수로 변환합니다.
관련성 기반 생성: 각 문서의 관련성 점수를 LLM에 통합하여 문서의 신뢰도를 평가하고 생성 프로세스를 안내합니다. 관련성 점수를 임베딩하여 LLM에 대한 큐로 사용하고, LLM은 내부 지식 또는 외부 증거 중 하나를 기반으로 답변을 생성합니다.
지식 신뢰도 검증: 생성된 답변의 정확성을 검증합니다. 문서의 신뢰성을 기반으로 답변의 신뢰성을 평가하는 출처 신뢰성 전략과, 제공된 지식이 매개변수 지식과 충돌하는지 여부를 확인하는 지식 일관성 전략을 제안합니다.
REAR 프레임워크를 위한 학습 방법은 다음과 같습니다.
이중 세분성 관련성 융합: 이진 분류 방법의 한계를 극복하기 위해 უხე형 및 세분형 관련성 감독을 통합합니다.
노이즈 저항 학습: 학습 절차에 부정적인 예제를 통합하여 관련 없는 콘텐츠에 대한 LLM의 판별 능력을 향상시킵니다.