מושגי ליבה
자동 미분 기술을 활용하여 검정 통계량의 누적 분포 함수(CDF)를 정확하게 모델링하면 해당 통계량의 표본 분포를 근사할 수 있다.
תקציר
이 논문은 자동 미분 기술을 활용하여 검정 통계량의 누적 분포 함수(CDF)를 모델링하고, 이를 통해 해당 통계량의 표본 분포를 근사하는 방법을 탐구한다.
주요 내용은 다음과 같다:
시뮬레이션 기반 추론 방법에서 신뢰구간 구축을 위해서는 검정 통계량의 CDF 또는 p-값 함수를 정확하게 모델링해야 한다.
CDF를 신경망 모델로 근사하면 해당 모델의 미분을 통해 검정 통계량의 표본 분포를 근사할 수 있다.
ON/OFF 문제와 SIR 모델 예제를 통해 CDF와 PDF 모델링의 정확성과 불확실성 정량화 방법을 탐구했다.
ALFFI 알고리즘은 이산 분포에 대해 충분히 정확한 CDF 모델을 제공하지 못했지만, 경험적 CDF를 직접 모델링하는 방법은 더 나은 결과를 보였다.
베이지안 신경망과 부트스트랩 신경망 등의 불확실성 정량화 기법을 적용했으나, 이산 분포의 고주파 특성으로 인해 만족스러운 결과를 얻지 못했다.
컨포멀 추론은 CDF와 PDF 모델의 불확실성을 정량화하는 데 효과적이었다.
סטטיסטיקה
검정 통계량 λ는 관측치 N, M과 모수 μ, ν에 의해 결정된다.
SIR 모델의 검정 통계량 λ는 관측 감염자 수 x와 모수 α, β에 의해 결정된다.
ציטוטים
"자동 미분(autograd)을 사용하면 CDF의 미분을 통해 PDF를 정확하게 근사할 수 있다."
"이산 분포의 CDF를 연속 분포로 근사하는 것은 쉽지 않은 과제이다."