Core Concepts
베이지안 신경망은 불확실성 추정을 위한 유망한 접근법이지만, 데이터 분포 외부에서의 불확실성 포착 능력이 제한적이다. 본 논문에서는 데이터 분포 외부 데이터의 불확실성을 통합하는 새로운 베이지안 신경망 구조를 제안한다.
Abstract
이 논문은 베이지안 신경망(BNN)의 불확실성 추정 능력을 향상시키기 위한 새로운 접근법을 제안한다. 기존 BNN은 주로 데이터 분포 내부(in-distribution, ID) 데이터에 기반하여 모수 분포를 학습하지만, 데이터 분포 외부(out-of-distribution, OOD) 데이터에 대한 불확실성 포착 능력이 제한적이다.
저자들은 먼저 OOD 데이터의 불확실성을 수학적으로 정의하고, ID 데이터와 OOD 데이터를 구분하는 개념을 제안한다. 이를 바탕으로 OOD 데이터의 불확실성을 BNN에 통합하는 새로운 구조인 ABNN(Attached Bayesian Neural Network)을 개발한다. ABNN은 기대 모듈(expectation module)과 분포 모듈(distribution module)로 구성된다. 기대 모듈은 기존 DNN과 유사한 역할을 하며, 분포 모듈은 ID 데이터와 OOD 데이터의 불확실성을 추정하는 역할을 한다.
저자들은 ABNN의 수렴성을 이론적으로 분석하고, 다양한 실험을 통해 기존 방법들과 비교하여 ABNN의 우수성을 입증한다. ABNN은 ID 데이터에 대한 예측 성능을 유지하면서도 OOD 데이터에 대한 불확실성을 효과적으로 포착할 수 있다.
Stats
데이터 분포 내부 데이터에 대한 예측 레이블의 분산은 데이터 분포 외부 데이터에 대한 예측 레이블의 분산보다 작다.
모수의 분산이 증가할수록 출력의 불확실성이 증가한다.
Quotes
"Bayesian Neural Networks (BNNs) have become one of the promising approaches for uncertainty estimation due to the solid theorical foundations."
"Instead of only seeking the distribution of neural network weights by in-distribution (ID) data, in this paper, we propose a new Bayesian Neural Network with an Attached structure (ABNN) to catch more uncertainty from out-of-distribution (OOD) data."