Core Concepts
DDPM ノイズ空間を利用することで、入力画像の構造を強く保持しつつ、簡単な操作で意味のある画像編集が可能になる。
Abstract
本論文では、DDPM (Denoising Diffusion Probabilistic Model) の潜在ノイズ空間を利用した新しい画像生成手法を提案する。
DDPM は画像生成に優れた性能を示しているが、その潜在ノイズ空間は編集に適していない。
そこで本手法では、入力画像の構造を強く保持する編集に適したノイズ空間を抽出する手法を提案する。
具体的には、入力画像から独立性の低い高分散のノイズ系列を抽出する。
この編集に適したノイズ空間を利用することで、テキストプロンプトの変更によるセマンティクスの変更や、手描きのストロークによる色編集など、様々な編集が可能になる。
また、既存の拡散モデルベースの編集手法にも適用可能であり、入力画像の構造とテクスチャの保持を改善できる。
Stats
入力画像から抽出したノイズ系列は、通常のサンプリングで得られるノイズ系列に比べて分散が大きく、時間方向に負の相関がある。
抽出したノイズ系列を固定したまま、テキストプロンプトを変更すると、入力画像の構造を保ちつつセマンティクスを変更できる。
抽出したノイズ系列に手描きのストロークを適用することで、入力画像の構造を保ちつつ色を編集できる。