Core Concepts
대화형 언어 모델에서 발생하는 환각 문제를 정의하고, 이를 평가하기 위한 다양한 방법론의 발전 과정을 종합적으로 살펴본다.
Abstract
이 논문은 자연어 생성(NLG) 분야에서 발생하는 환각 문제에 대한 종합적인 리뷰를 제공한다.
먼저 환각의 정의와 분류 체계를 살펴본다. 환각은 크게 출처 충실도(Source Faithfulness, SF)와 세계 사실성(World Factuality, WF)으로 구분된다. SF는 생성 출력이 입력 정보를 얼마나 정확하게 반영하는지를 측정하고, WF는 생성 출력이 일반적인 세계 지식과 얼마나 부합하는지를 평가한다.
이어서 대화형 언어 모델(LLM) 등장 이전의 환각 평가 방법론을 소개한다. 참조 기반 평가와 참조 없는 평가 방법이 있으며, 주로 요약 생성 작업에 초점을 맞추고 있다. 이러한 전통적인 방법은 SF 측정에 주력한다.
LLM 등장 이후에는 LLM 자체를 평가 도구로 활용하거나 LLM을 직접 평가 대상으로 하는 새로운 방법론이 등장했다. LLM은 범용성이 높아 다양한 작업에 활용될 수 있으므로, 일반 사실 지식(WF)에 대한 평가가 중요해졌다. 이를 위해 최신 연구에서는 시간 변화에 따른 최신 지식 반영, 장문 생성, 추론 능력 등을 평가하는 벤치마크를 제안하고 있다.
향후 과제로는 종합적이고 통일된 환각 평가 체계 구축, 환각과 일반적인 오류 구분, 해석 가능성 제고, 장문 생성/이해, 다양한 도메인 및 언어에 대한 평가 등이 제시된다.
Stats
대화형 언어 모델은 다양한 작업에서 환각을 발생시킬 수 있다.
환각은 출처 충실도(SF)와 세계 사실성(WF)으로 구분된다.
전통적인 환각 평가 방법은 주로 요약 생성 작업에 초점을 맞추고 있다.
LLM 등장 이후에는 LLM 자체를 평가 도구로 활용하거나 LLM을 직접 평가 대상으로 하는 새로운 방법론이 등장했다.
최신 연구에서는 시간 변화, 장문 생성, 추론 능력 등을 평가하는 벤치마크를 제안하고 있다.
Quotes
"환각은 자연어 생성(NLG)에서 마치 방 안의 코끼리와 같이 명백하지만 종종 간과되어 왔다."
"SF는 출력이 입력 정보를 얼마나 정확하게 반영하는지를 측정하고, WF는 출력이 일반적인 세계 지식과 얼마나 부합하는지를 평가한다."
"LLM은 범용성이 높아 다양한 작업에 활용될 수 있으므로, 일반 사실 지식(WF)에 대한 평가가 중요해졌다."