Core Concepts
拡散モデルにおいて、時間変化するノイズを導入することで、生成画像の品質を向上させることができる。特に、ブルーノイズを活用することで、高周波成分の保持と低周波成分の生成のバランスを取ることができる。
Abstract
本論文では、従来の拡散モデルで用いられてきたガウシアンノイズに代わり、時間変化するノイズを導入することで、生成画像の品質を向上させる手法を提案している。
具体的には以下の3つの貢献がある:
- 時間変化するノイズモデルを提案し、ブルーノイズを活用することで、高周波成分と低周波成分のバランスを取ることができる。
- ガウシアンブルーノイズマスクを効率的に生成する手法を提案し、高解像度画像への適用を可能にした。
- 訓練時のデータサンプル間の相関を利用することで、生成画像の品質をさらに向上させた。
提案手法は、既存の拡散モデルと比較して、定量的・定性的な評価において優れた性能を示している。特に、高解像度画像の生成において顕著な改善が見られた。
Stats
拡散モデルにおいて、ガウシアンノイズではなく、時間変化するノイズを用いることで、生成画像の品質が向上する。
ブルーノイズを活用することで、高周波成分と低周波成分のバランスが取れた画像を生成できる。
訓練時のデータサンプル間の相関を利用することで、生成画像の品質をさらに向上させることができる。
Quotes
"Most of the existing diffusion models use Gaussian noise for training and sampling across all time steps, which may not optimally account for the frequency contents reconstructed by the denoising network."
"We propose a time-varying noise model to incorporate correlated noise into the training process, as well as a method for fast generation of correlated noise mask."
"Our model is built upon deterministic diffusion models and utilizes blue noise to help improve the generation quality compared to using Gaussian white (random) noise only."