本論文は、拡散モデルの反復的な除雑音プロセスを最適化モデルとして再定義し、移動平均メカニズムを活用することで、過去のすべてのサンプルを活用し、周波数領域での安定化を実現する手法「Moving Average Sampling in Frequency domain (MASF)」を提案している。
具体的には以下の3つの点に着目している:
除雑音されたサンプルxtを元のデータ空間x0に写像し、そこで移動平均を行うことで、各ステップでの分布のずれを抑制する。
離散wavelet変換を用いて、サンプルを周波数成分に分解し、各成分に対して個別に移動平均を行うことで、周波数成分の進化に合わせた安定化を実現する。
低周波成分の重みを初期に高く、高周波成分の重みを後期に高くする動的な重み付けスキームを導入し、周波数成分の進化に合わせた最適な安定化を実現する。
これらの手法を組み合わせることで、既存の拡散モデルに対して大幅なパフォーマンス向上を達成している。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Yurui Qian,Q... alle arxiv.org 03-27-2024
https://arxiv.org/pdf/2403.17870.pdfDomande più approfondite