Core Concepts
異なる時間ステップ間での最適化方向の衝突が、拡散トレーニングの収束速度を遅くしていることを指摘し、Min-SNR-γ重み付け戦略を導入することで、収束速度を著しく向上させる。
Abstract
1. 導入
デノイジング拡散モデルは画像生成の主要手法。
本論文では、時間ステップ間での最適化方向の衝突により収束が遅くなる問題を指摘。
2. 問題特定
時間ステップごとに異なるタスクとして扱うため、多目的学習問題として拡散トレーニングを捉える。
3. Min-SNR-γ重み付け戦略
各時間ステップの損失ウェイトを難易度に基づいて割り当て、衝突する勾配問題を緩和。
4. 実験結果
Min-SNR-γ戦略は他の方法よりも収束が速く、ImageNet-256データセットで最先端のFIDスコアを達成。
Stats
拡散モデルは数千個までのタスク数に対応するため、従来の多目的学習手法とは異なるアプローチが必要。
Quotes
"By leveraging a non-conflicting weighting strategy, our method can converge 3.4 times faster than baseline, resulting in superior performance."
"Our results demonstrate a significant improvement in converging speed, 3.4× faster than previous weighting strategies."