Core Concepts
본 연구는 텍스트 데이터의 Out-of-Distribution 탐지를 위해 Transformer 기반의 변분 추론 프레임워크 VI-OOD를 제안한다. VI-OOD는 조건부 확률 p(y|x) 대신 결합 확률 p(x,y)를 최대화하여 OOD 탐지에 유용한 잠재 표현을 학습한다.
Abstract
본 연구는 텍스트 데이터의 Out-of-Distribution(OOD) 탐지를 위한 새로운 변분 추론 프레임워크 VI-OOD를 제안한다. 기존 OOD 탐지 방법들은 조건부 확률 p(y|x)를 최대화하여 ID 분류 성능을 높이는 데 초점을 맞추었지만, 이로 인해 OOD 탐지에 유용한 정보가 간과될 수 있다는 문제점을 지적한다.
VI-OOD는 결합 확률 p(x,y)를 최대화하는 방식으로 OOD 탐지에 유용한 잠재 표현을 학습한다. 구체적으로, Transformer 모델의 중간 은닉 상태를 활용하여 입력 텍스트의 풍부한 문맥 정보를 효과적으로 활용한다. 또한 변분 자동인코더 구조를 통해 입력 텍스트의 재구성 목표를 동적으로 결정한다.
실험 결과, VI-OOD는 다양한 텍스트 분류 작업에서 기존 OOD 탐지 방법들의 성능을 일관되게 향상시킨다. 특히 Mahalanobis Distance와 같은 거리 기반 OOD 탐지기에 큰 이점을 제공한다.
Stats
중간 은닉 상태가 최종 은닉 상태보다 OOD 탐지 성능이 우수하다.
중간 은닉 상태 중 9-13번째 층의 성능이 가장 좋다.
Quotes
"중간 은닉 상태는 ID 분류 작업에는 불필요한 정보를 포함하지만 OOD 탐지에는 중요한 정보를 담고 있다."