Core Concepts
LLM 사용자와 실무자가 의미 있는 반사실적 예시를 활용하여 LLM의 행동을 분석하고 이해할 수 있도록 지원한다.
Abstract
이 연구는 LLM 사용자와 실무자가 LLM의 행동을 분석하고 이해할 수 있도록 지원하는 방법을 제안한다.
먼저, 문장의 구문 구조를 활용하여 의미 있고 읽기 쉬운 반사실적 예시를 생성하는 알고리즘을 제안한다. 이 알고리즘은 단어, 구, 절, 문장 단위로 텍스트를 분할하고 제거 및 대체 작업을 수행하여 문법적으로 올바르고 원문과 비교 가능한 반사실적 예시를 생성한다.
다음으로, LLM Analyzer라는 대화형 시각화 도구를 제안한다. LLM Analyzer는 사용자가 생성된 반사실적 예시를 탐색하고 분석할 수 있도록 지원한다. 사용자는 반사실적 예시의 개별 특성과 함께 중요 텍스트 세그먼트의 영향력을 확인할 수 있다. 또한 세그먼트의 조합이 LLM 예측에 미치는 영향을 분석할 수 있다. 이를 통해 사용자는 LLM의 행동을 종합적으로 이해할 수 있다.
이 연구는 알고리즘 실험, 사용 사례, 사용자 연구, 전문가 인터뷰를 통해 제안된 방법의 효과성과 유용성을 입증한다.
Stats
생성된 반사실적 예시의 97.2%가 문법적으로 올바름
문장당 평균 46개의 반사실적 예시 생성
반사실적 예시 생성 시간은 1초 미만
Quotes
"반사실적 설명만으로는 충분하지 않고, 속성 기여도와 앵커 설명이 함께 제공되어야 모델에 대한 종합적인 이해가 가능합니다."
"텍스트 데이터에 적용하기 위해서는 구문 구조를 고려한 세분화가 필요합니다. 기존 XAI 방법은 텍스트에 적합하지 않습니다."