Core Concepts
신경망의 입력-출력 분포를 정확하게 특성화하기 위한 샘플 없는 모멘트 전파 기술을 제안한다. 이를 위해 Heaviside, ReLU, GELU 등 비선형 활성화 함수의 공분산에 대한 해석적 솔루션을 도출하였다.
Abstract
이 논문은 신경망의 입력-출력 분포를 정확하게 특성화하기 위한 샘플 없는 모멘트 전파 기술을 제안한다.
핵심 내용은 다음과 같다:
- 신경망의 신뢰성과 견고성을 측정하기 위해서는 불확실성 정량화가 중요하지만, 기존 방법들은 비용이 많이 들거나 부정확한 경우가 많다.
- 이 논문에서는 평균 벡터와 공분산 행렬을 신경망 전체에 걸쳐 전파하여 입력-출력 분포를 정확하게 특성화할 수 있는 샘플 없는 모멘트 전파 기술을 제안한다.
- 이 기술의 핵심은 Heaviside, ReLU, GELU 등 비선형 활성화 함수의 공분산에 대한 해석적 솔루션을 도출한 것이다.
- 제안된 기술의 광범위한 적용 가능성과 장점을 실험을 통해 보여준다. 구체적으로 학습된 신경망의 입력-출력 분포 분석과 베이지안 신경망 학습에 적용하였다.
Stats
신경망의 입력 x가 평균 μ와 공분산 Σ를 가지는 다변량 정규 분포를 따를 때, 은닉층 출력 y의 평균과 공분산은 다음과 같이 계산된다:
μy = Wμx + b
Σy = WΣxW⊤
Quotes
"신경망의 신뢰성과 견고성을 측정하기 위해서는 정확한 불확실성 정량화가 필수적이다."
"기존 방법들은 비용이 많이 들거나 부정확한 경우가 많다."
"제안된 기술은 Heaviside, ReLU, GELU 등 비선형 활성화 함수의 공분산에 대한 해석적 솔루션을 제공한다."