Core Concepts
본 연구에서는 매우 일반적이고 광범위한 마르코프 체인 클래스인 Ito 체인을 고려한다. 특히 노이즈가 독립적이고 정규분포가 아닌 경우에도 체인과 해당 확산 사이의 W2 거리를 추정한다. 이를 통해 다양한 특수 사례를 다룰 수 있으며, 일부 경우에는 기존 결과를 개선하거나 새로운 결과를 제시한다.
Abstract
본 연구는 매우 일반적이고 광범위한 마르코프 체인 클래스인 Ito 체인을 다룬다. 특히 다음과 같은 특징을 가진다:
노이즈가 독립적이고 정규분포가 아닌 경우를 고려한다. 이는 실제 응용 사례에서 자주 관찰되는 특성이다.
노이즈가 현재 상태에 의존하는 경우를 다룬다. 이는 특히 SGD 분석에서 중요하다.
강한 단조성/강 볼록성/소산성 가정이 필요하지 않다. 이는 많은 실제 문제에서 충족되지 않는 제한적인 가정이다.
W2 거리를 이용하여 체인과 해당 확산 사이의 근사 오차를 추정한다. 이는 기존 연구에 비해 더 강력한 보장을 제공한다.
구체적으로, 저자는 다음과 같은 결과를 도출한다:
SGLD의 경우 기존 문헌 중 가장 좋은 보장을 제공한다.
SGD와 SGLB의 경우 노이즈가 비정규분포인 상황에서 최초로 근사 오차를 추정한다.
전반적으로 다양한 특수 사례에 대해 기존 결과를 개선하거나 새로운 결과를 제시한다.
Stats
체인 Xk의 초기 벡터 x0에 대한 제한: R2
0 = max{1; ∥x0∥2}
체인 Xk의 최대 제곱 노름 상한: R2(t) ≥ max{1; maxk′≤k E[∥Xk′∥2]}
체인 Xk의 드리프트 b가 M0-Lipschitz: ∥b(x) - b(x′)∥ ≤ M0∥x - x′∥
체인 Xk의 편향 드리프트 δk가 제한됨: ∥δk∥2 ≤ M1
2η2α + ∥Xk∥2
체인 Xk의 노이즈 ǫk가 단위 공분산을 가지며 4차 모멘트가 제한됨: E[∥ǫk(x)∥4] ≤ M2
ǫ η
β
체인 Xk의 공분산 계수 σ가 σ1I ≥ σ(x) = σ(x)T ≥ σ0I, M0-Lipschitz임
체인 Xk의 공분산 시프트 ∆k가 제한됨: ηγTr(∆2
k) ≤ M1
2η2α + ∥Xk∥2