Core Concepts
確率微分方程式を用いることで、連続的ベイズ流ネットワークと拡散モデルの関係を明らかにし、連続的ベイズ流ネットワークの学習と推論を高速化することができる。
Abstract
本論文は、連続的ベイズ流ネットワーク(BFN)と拡散モデル(DM)の関係を明らかにするために、確率微分方程式(SDE)を用いて分析を行っている。
まず、連続データを扱うBFNについて、その雑音付加プロセスがある線形SDEの解であることを示した(定理4.1)。さらに、BFNの回帰損失関数がデノイジングスコアマッチング(DSM)と等価であることを示し(定理4.2)、BFNのサンプラーが対応する逆方向SDEの近似的な1次オイラー解であることを明らかにした(命題4.2)。
次に、離散データを扱うBFNについても同様の分析を行った。離散データの場合、BFNは潜在変数zに関する線形SDEを解くことが分かった(定理5.1)。また、BFNの回帰損失関数がzに関するDSMと等価であることを示した(定理5.2)。さらに、BFNのサンプラーは逆方向SDEの近似的な1次オイラー解であることを明らかにした(命題5.3)。
これらの理論的な分析に基づき、拡散モデルの高速サンプリング手法をBFNに適用することで、BFNのサンプリング性能を大幅に向上させることができた。具体的には、BFN-Solverと呼ばれる高次のODE/SDE解法を提案し、実験的に連続データと離散データの両方で大幅な性能向上を示した。
Stats
連続データ(CIFAR-10)の場合、BFN-Solver++2は10回の関数評価で元のBFNサンプラーよりも大幅にFIDが改善された。
離散データ(text8)の場合、BFN-Solver2は10回の関数評価で元のBFNサンプラーよりも大幅にスペリング精度が向上した。
Quotes
"Bayesian flow networks (BFNs) iteratively refine the parameters, instead of the samples in diffusion models (DMs), of distributions at various noise levels through Bayesian inference."
"Owing to its differentiable nature, BFNs are promising in modeling both continuous and discrete data, while simultaneously maintaining fast sampling capabilities."