核心概念
観測プロセスを拡散モデルの訓練目的に統合することで、少ない関数評価回数でも高品質な画像生成を実現する。
要約
本論文は、観測誘導型拡散確率モデル(OGDM)を提案している。OGDMは、拡散プロセスの観測情報を訓練目的に統合することで、少ない関数評価回数(NFEs)でも高品質な画像生成を実現する。
具体的には以下の通り:
- 拡散プロセスの観測情報を表す確率分布を導入し、これを訓練目的に組み込む。
- 観測情報は、ノイズレベルに依存する識別器のスコアで実装される。
- この観測誘導型の訓練目的は、推論時の負対数尤度を正確に最小化するように設計されている。
- 提案手法は、既存の高速サンプリング手法と組み合わせることで、さらなる性能向上が可能である。
- 提案手法は、ゼロから訓練するだけでなく、事前学習モデルの微調整にも適用できる。
全体として、提案手法は少ない計算コストで高品質な画像生成を実現する。
統計
拡散モデルの1ステップあたりの関数評価回数(NFEs)を減らすと、ベースラインモデルでは生成画像の品質が大幅に劣化するが、提案手法ではその劣化を抑えられる。
提案手法を用いると、NFEsが10回程度でも、ベースラインモデルよりも高品質な画像が生成できる。
引用
"我々のアプローチは、推論時の正確な対数尤度を最大化することができ、大きなステップサイズを使用する高速サンプリング手法でも有効である。"
"観測プロセスは、逆プロセスがガウス分布から逸脱する場合に、特に重要な役割を果たし、より正確なデータ多様体に向けて脱ノイズステップを調整する。"