核心概念
連続正規化流れを用いた確率分布の学習において、目標分布が有界な台を持つ、強対数凹である、あるいはガウス混合分布である場合の、非漸近的な誤差界を導出した。
要約
本論文では、連続正規化流れ(CNF)を用いた確率分布の学習について理論的な解析を行っている。
まず、線形補間を用いたCNFの速度場の正則性を示した。具体的には、以下の3点を示した:
空間変数xに関して、速度場v*は一様にリプシッツ連続である。
時間変数tに関して、速度場v*はt↓0のとき、O(t^-2)のオーダーでリプシッツ定数が発散する。
空間変数xに関して、速度場v*は最大で線形成長する。
次に、目標分布が有界な台を持つ、強対数凹である、あるいはガウス混合分布である場合の、CNFによる分布推定誤差の非漸近的な上界を導出した。具体的には、流れマッチング法を用いて学習したCNFによる分布推定誤差は、サンプルサイズnに対してe^O(n^(-1/(d+5)))のオーダーで収束することを示した。
この収束率は、速度場の時間変数に関する特異性によって制限されている。特異性がなければ、e^O(n^(-1/(d+3)))のオーダーで収束することが示される。
統計
目標分布が有界な台を持つ場合、速度場v*のリプシッツ定数は時間tに関してO(t^-2)のオーダーで発散する。
目標分布が強対数凹または混合ガウス分布の場合、速度場v*のリプシッツ定数は時間tに関してO(t^-2)のオーダーで発散する。
CNFによる分布推定誤差は、サンプルサイズnに対してe^O(n^(-1/(d+5)))のオーダーで収束する。
引用
"連続正規化流れ(CNFs)は、確率分布を学習するための生成モデルであり、常微分方程式に基づいている。"
"CNFsは、大規模な画像合成、タンパク質構造予測、分子生成など、様々な応用分野で顕著な経験的成功を示してきた。"