Core Concepts
대화형 해석 도구를 통해 사용자가 대규모 언어 모델의 동작을 이해할 수 있도록 지원한다.
Abstract
이 논문은 LLMCHECKUP이라는 대화형 해석 도구를 소개한다. LLMCHECKUP은 사용자가 대규모 언어 모델(LLM)의 동작을 이해할 수 있도록 지원한다. 주요 특징은 다음과 같다:
단일 LLM을 사용하여 사용자 의도 인식, 하위 작업 수행, 설명 생성, 자연어 응답 생성 등 4가지 기능을 수행한다. 이를 통해 복잡한 시스템 구조를 단순화할 수 있다.
다양한 해석 가능성 방법(화이트박스, 블랙박스)을 통합하여 사용자에게 제공한다. 이includes 특징 귀속, 데이터 증강, 반사실 생성, 합리화 등.
사용자 의도 인식을 위해 유도 디코딩과 다중 프롬프트 구문 분석 기법을 제안한다.
사용자 수준에 맞춘 튜토리얼 기능을 제공하여 XAI 지식이 부족한 사용자도 활용할 수 있다.
사용자가 커스텀 입력을 제공하고 프롬프트를 수정할 수 있는 기능을 제공한다.
LLMCHECKUP은 사실 확인과 상식 질문 답변 작업에 적용되었으며, 다양한 LLM에 대한 성능 평가 결과를 제시한다.
Stats
대규모 언어 모델을 사용하면 사용자 의도 인식 정확도가 향상된다.
데이터 증강 작업에서 Stable Beluga 2 모델이 일관성과 유창성 측면에서 가장 우수한 성능을 보였다.
Quotes
"대화형 해석 도구는 사용자의 이해를 높이는 데 효과적이다."
"단일 모델 접근 방식은 다중 모듈 시스템의 복잡성을 단순화할 수 있다."