Core Concepts
Deep Generative Models (DGMs)의 특성을 활용하여 새로운 In-Distribution (ID) 데이터셋에 대한 재학습 없이도 Out-of-Distribution (OOD) 데이터를 탐지할 수 있는 방법을 제안한다.
Abstract
이 논문은 DGMs가 저수준 특징을 학습하는 경향이 있고, DGMs의 로그-우도 하한이 모델 입력과 출력 사이의 조건부 엔트로피에 의해 결정된다는 두 가지 가설을 제시하고 실험적으로 입증한다.
이를 바탕으로 논문에서는 이미지 지우기 전략을 제안하여 각 ID 데이터셋에 대한 고유한 조건부 엔트로피 분포를 생성한다. 그리고 Uncertainty Estimation Network (UEN)를 설계하여 이 조건부 엔트로피 분포의 차이를 포착할 수 있도록 한다.
최종적으로 UEN을 ImageNet 데이터셋에 학습시켜 새로운 ID 데이터셋에 대한 재학습 없이도 OOD 데이터를 탐지할 수 있는 CETOOD 방법을 제안한다. 실험 결과, CETOOD는 기존 최신 기법들과 비교해 성능이 유사하면서도 모델 배포 비용이 크게 감소한다.
Stats
DGMs는 복잡한 데이터셋에서 학습할 경우 단순 데이터셋의 로그-우도 하한에 접근할 수 있다.
이미지 지우기 전략을 통해 각 ID 데이터셋에 대한 고유한 조건부 엔트로피 분포를 생성할 수 있다.
제안한 UEN 모델은 ImageNet 데이터셋에서 학습하여 새로운 ID 데이터셋에 대한 재학습 없이도 OOD 데이터를 효과적으로 탐지할 수 있다.
Quotes
"DGMs는 저수준 특징을 학습하는 경향이 있다."
"DGMs의 로그-우도 하한은 모델 입력과 출력 사이의 조건부 엔트로피에 의해 결정된다."
"이미지 지우기 전략을 통해 각 ID 데이터셋에 대한 고유한 조건부 엔트로피 분포를 생성할 수 있다."