Core Concepts
ノイズの多い訓練データからも、Tweedieの公式を用いることで、正確な拡散モデルを学習することができる。
Abstract
本論文では、ノイズの多い訓練データからも正確な拡散モデルを学習する手法を提案している。
主な貢献は以下の通り:
Tweedieの公式を2回適用することで、ノイズレベルσt ≥ σtnの場合の最適な除ノイズ器を効率的に学習する手法を提案した。
一貫性ロスを導入することで、ノイズレベルσt ≤ σtnの場合の最適な除ノイズ器も学習できるようにした。これにより、ノイズの多い訓練データからも、元の分布から生成できる拡散モデルを学習できるようになった。
提案手法を用いてStable Diffusion XLをファインチューニングし、訓練データの記憶が大幅に減少しつつ、性能を維持できることを示した。
極端に汚れた訓練画像を正確に再構築できることから、拡散モデルが訓練データを大量に記憶していることを示した。これは著作権や プライバシーの問題につながる可能性がある。
Stats
ノイズレベルが高い訓練データでも、提案手法を用いることで、ノイズレベルに関わらず同等の性能を達成できる。
提案手法を用いて学習したモデルは、訓練データの記憶が大幅に減少している。
Quotes
"ノイズの多い訓練データからも、Tweedieの公式を用いることで、正確な拡散モデルを学習することができる。"
"提案手法を用いてStable Diffusion XLをファインチューニングし、訓練データの記憶が大幅に減少しつつ、性能を維持できることを示した。"