Core Concepts
언어 모델은 생성된 문맥에 대한 편향된 선호를 보이며, 이는 정확한 정보를 포함하고 있는 검색된 문맥을 충분히 활용하지 못하게 한다.
Abstract
이 연구는 언어 모델이 생성된 문맥과 검색된 문맥을 통합하는 메커니즘을 조사한다. 연구진은 생성된 문맥과 검색된 문맥이 서로 상충되는 데이터셋을 구축하여, 언어 모델의 응답이 어느 문맥에 기반하는지 추적할 수 있게 하였다.
실험 결과, GPT-4/3.5와 Llama2 등 다수의 언어 모델이 생성된 문맥에 대한 편향된 선호를 보였다. 이는 생성된 문맥이 질문과 더 유사하고 완전성이 높기 때문인 것으로 나타났다. 이러한 편향은 확증 편향(confirmation bias)과는 무관한 것으로 확인되었다.
이 연구는 언어 모델이 다양한 정보원을 효과적으로 활용하는 데 어려움이 있음을 보여준다. 특히 인터넷상의 언어 모델 생성 콘텐츠가 증가함에 따라, 이러한 편향은 심각한 문제를 야기할 수 있다. 연구진은 이를 해결하기 위해 검색 시스템의 문단 분할 최적화 등 기존 검색 기반 방법을 개선할 필요가 있다고 제안한다.
Stats
생성된 문맥을 사용한 경우 정답 개수가 감소했다.
GPT-4, GPT-3.5, Llama2-13b, Llama2-7b 모델 모두 이러한 경향을 보였다.
Quotes
"언어 모델은 생성된 문맥에 대한 편향된 선호를 보이며, 이는 정확한 정보를 포함하고 있는 검색된 문맥을 충분히 활용하지 못하게 한다."
"생성된 문맥이 질문과 더 유사하고 완전성이 높기 때문에 언어 모델이 이를 선호하는 것으로 나타났다."