Core Concepts
本論文では、制約付きサンプリングの問題を無制約サンプリングの問題に変換するために、罰則関数を導入したペナルティ付きランジェビンダイナミクス(PLD)およびペナルティ付き非減衰ランジェビンモンテカルロ(PULMC)アルゴリズムを提案し、分析する。
Abstract
本論文では、制約付きサンプリングの問題を扱う。目標は、凸集合Cに制約された分布π(x) ∝e−f(x)からサンプリングすることである。
提案手法の概要は以下の通り:
罰則関数Sを導入し、ペナルティ付きターゲット分布πδ(x) ∝exp(−f(x) − 1
δS(x))を定義する。
PLD: ペナルティ付きオーバーダンプドランジェビンアルゴリズム
PULMC: ペナルティ付き非減衰ランジェビンモンテカルロアルゴリズム
主な結果は以下の通り:
fが滑らかな場合、PLDのTV距離での収束レートは ˜
O(d/ε10)、PULMCのTV距離での収束レートは ˜
O(√d/ε7)。
fが非凸滑らかな場合、確率的勾配を用いたPSGLDとPSGULMCのW2距離での収束レートはそれぞれ ˜
O(d17/λ9
∗)と ˜
O(d7/μ3
∗)。
fが強convexで滑らかな場合、PSGLDとPSGULMCのW2距離での収束レートはそれぞれ ˜
O(d/ε18)と ˜
O(d√d/ε39)。
Stats
制約集合Cは凸体であり、原点を含み、半径rの球に含まれ、半径Rの球に含まれる。
関数fはL-滑らかである。