이 논문은 대형 언어 모델(LLM)의 검색 증강 생성(RAG) 기술에 대해 다룹니다. RAG는 LLM에 최신 관련 지식을 제공하여 지식 부족이나 환각을 해결하는 데 큰 가치를 보여주지만, 여전히 복잡한 다중 단계 질문을 이해하고 관련 문서를 단계적으로 검색하는 데 어려움이 있습니다.
이 연구에서는 먼저 LLM이 부분적인 지식을 제공받은 상황에서도 누락된 정보를 정확하게 식별할 수 있음을 실험적으로 검증했습니다. 이를 바탕으로 저자들은 누락 정보 안내 검색-추출-해결 패러다임(MIGRES)을 제안했습니다. MIGRES는 누락된 정보를 식별하여 이를 활용해 단순하고 다양한 새로운 질문을 생성함으로써 후속 검색 과정을 안내합니다. 또한 문서 수준의 재순위화 필터링 전략을 도입하여 관련성이 낮은 내용을 제거하고, LLM의 정보 추출 능력을 활용하여 유용한 정보를 추출합니다.
실험 결과, MIGRES는 다양한 지식 집약적 질문 답변 데이터셋에서 기존 방법들을 능가하는 성능을 보였으며, 외부 지식 활용의 효율성도 향상되었습니다. 이는 LLM이 누락된 정보를 인식하고 활용할 수 있다는 발견을 바탕으로 한 접근법의 효과를 보여줍니다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések