Core Concepts
언어 기반 잠재 표현을 활용하면 사용자가 관심 있는 현상을 자연어로 지정할 수 있어 분포 외 데이터 탐지의 투명성과 제어성을 높일 수 있다.
Abstract
이 논문은 자율주행 시스템에서 분포 외 데이터(out-of-distribution, OOD) 탐지를 위한 새로운 접근법을 제안한다. 기존의 OOD 탐지 방법은 고정된 설정의 인코더 모델을 사용하여 사용자와의 효과적인 상호작용 기능이 부족했다. 이 논문에서는 멀티모달 모델 CLIP을 활용하여 이미지와 텍스트 표현의 코사인 유사도를 새로운 잠재 표현으로 사용함으로써 OOD 탐지의 투명성과 제어성을 높였다.
실험 결과, 제안한 언어 기반 잠재 표현이 기존의 비전 인코더 표현보다 우수한 성능을 보였으며, 표준 표현과 결합하면 탐지 성능이 향상되었다. 이를 통해 사용자가 관심 있는 현상을 자연어로 지정할 수 있어 OOD 탐지 과정의 투명성과 제어성이 향상되었다.
Stats
명확하고 밝은 개방 도로를 기대하는 상황에서 벗어나는 것은 OOD 입력으로 간주되어야 한다.
제안한 언어 기반 잠재 표현 방법은 기존 비전 인코더 표현보다 우수한 성능을 보였다.
언어 기반 표현과 표준 표현을 결합하면 OOD 탐지 성능이 향상되었다.
Quotes
"언어 기반 잠재 표현을 활용하면 사용자가 관심 있는 현상을 자연어로 지정할 수 있어 OOD 탐지 과정의 투명성과 제어성이 향상된다."
"실험 결과, 제안한 언어 기반 잠재 표현이 기존의 비전 인코더 표현보다 우수한 성능을 보였으며, 표준 표현과 결합하면 탐지 성능이 향상되었다."