이 논문에서는 베이지안 딥러닝에서 모델 가중치 사후 분포와 예측 분포를 정확하게 계산하기 어려운 문제를 다룬다. 대신 최대 사후 추정치(MAP)와 이의 근처 곡률을 활용하여 근사적으로 추정하는 라플라스 근사 방법을 제안한다.
라플라스 근사의 핵심 계산 단계는 로그 사후 분포의 헤시안 행렬을 계산하고 역행렬을 구하는 것이다. 이는 딥 신경망의 고차원 매개변수 공간에서 계산적으로 매우 부담스러운 작업이다.
이 논문에서는 헤시안 계산 및 역행렬 계산 없이도 라플라스 근사와 동일한 예측 분산을 추정할 수 있는 새로운 방법론인 "헤시안 프리 라플라스(HFL)" 근사를 제안한다. HFL은 MAP 추정치와 출력 함수를 정규화한 추가 추정치만을 사용하여 예측 분산을 계산한다.
이론적 분석과 실험 결과를 통해 HFL이 기존의 라플라스 근사 방법과 유사한 성능을 보이면서도 계산 복잡도 면에서 훨씬 효율적임을 보인다. 또한 HFL은 모델 매개변수의 불확실성 정량화에도 활용될 수 있다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問