本論文は、拡散モデルの反復的な除雑音プロセスを最適化モデルとして再定義し、移動平均メカニズムを活用することで、過去のすべてのサンプルを活用し、周波数領域での安定化を実現する手法「Moving Average Sampling in Frequency domain (MASF)」を提案している。
具体的には以下の3つの点に着目している:
除雑音されたサンプルxtを元のデータ空間x0に写像し、そこで移動平均を行うことで、各ステップでの分布のずれを抑制する。
離散wavelet変換を用いて、サンプルを周波数成分に分解し、各成分に対して個別に移動平均を行うことで、周波数成分の進化に合わせた安定化を実現する。
低周波成分の重みを初期に高く、高周波成分の重みを後期に高くする動的な重み付けスキームを導入し、周波数成分の進化に合わせた最適な安定化を実現する。
これらの手法を組み合わせることで、既存の拡散モデルに対して大幅なパフォーマンス向上を達成している。
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain
提案手法のMASF(Moving Average Sampling in Frequency domain)は、既存の拡散モデルに対して大幅なパフォーマンス向上を達成しています。MASFの理論的な裏付けは、以下の要素に基づいています。まず、MASFは反復的な除雑音プロセスをモデル最適化として捉え、前のすべてのサンプルを活用する移動平均メカニズムを活用しています。さらに、MASFはサンプルを異なる周波数成分に分解し、各成分の動的進化を可能にすることで、周波数領域での動的な移動平均を実行しています。これにより、周波数成分ごとに異なる進化を促進し、除雑音プロセス全体での調和の取れた安定化を実現しています。MASFの理論的な裏付けは、モデル最適化と周波数進化の統合により、除雑音プロセスの安定性を向上させることにあります。