Core Concepts
본 연구에서는 매우 일반적이고 광범위한 마르코프 체인 클래스인 Ito 체인을 고려한다. 특히 노이즈가 독립적이고 정규분포가 아닌 경우에도 체인과 해당 확산 사이의 W2 거리를 추정한다. 이를 통해 다양한 특수 사례를 다룰 수 있으며, 일부 경우에는 기존 결과를 개선하거나 새로운 결과를 제시한다.
Abstract
본 연구는 매우 일반적이고 광범위한 마르코프 체인 클래스인 Ito 체인을 다룬다. 특히 다음과 같은 특징을 가진다:
- 노이즈가 독립적이고 정규분포가 아닌 경우를 고려한다. 이는 실제 응용 사례에서 자주 관찰되는 특성이다.
- 노이즈가 현재 상태에 의존하는 경우를 다룬다. 이는 특히 SGD 분석에서 중요하다.
- 강한 단조성/강 볼록성/소산성 가정이 필요하지 않다. 이는 많은 실제 문제에서 충족되지 않는 제한적인 가정이다.
- W2 거리를 이용하여 체인과 해당 확산 사이의 근사 오차를 추정한다. 이는 기존 연구에 비해 더 강력한 보장을 제공한다.
구체적으로, 저자는 다음과 같은 결과를 도출한다:
- SGLD의 경우 기존 문헌 중 가장 좋은 보장을 제공한다.
- SGD와 SGLB의 경우 노이즈가 비정규분포인 상황에서 최초로 근사 오차를 추정한다.
- 전반적으로 다양한 특수 사례에 대해 기존 결과를 개선하거나 새로운 결과를 제시한다.
Stats
체인 Xk의 초기 벡터 x0에 대한 제한: R2
0 = max{1; ∥x0∥2}
체인 Xk의 최대 제곱 노름 상한: R2(t) ≥ max{1; maxk′≤k E[∥Xk′∥2]}
체인 Xk의 드리프트 b가 M0-Lipschitz: ∥b(x) - b(x′)∥ ≤ M0∥x - x′∥
체인 Xk의 편향 드리프트 δk가 제한됨: ∥δk∥2 ≤ M1
2η2α + ∥Xk∥2
체인 Xk의 노이즈 ǫk가 단위 공분산을 가지며 4차 모멘트가 제한됨: E[∥ǫk(x)∥4] ≤ M2
ǫ η
β
체인 Xk의 공분산 계수 σ가 σ1I ≥ σ(x) = σ(x)T ≥ σ0I, M0-Lipschitz임
체인 Xk의 공분산 시프트 ∆k가 제한됨: ηγTr(∆2
k) ≤ M1
2η2α + ∥Xk∥2