本研究では、潜在拡散モデル(LDM)で生成された画像を検出する新しい手法「AEROBLADE」を提案している。LDMは、事前に訓練された自己符号化器(AE)を使って、低次元の潜在表現から高解像度の画像を生成する。
AEROBLADE は、この AE の再構成誤差を利用して、生成画像と実画像を区別する。生成画像は AE によって正確に再構成できるのに対し、実画像は再構成誤差が大きくなる。この性質を利用して、複数の LDM の AE の再構成誤差の最小値を取ることで、訓練なしで高精度な検出が可能となる。
実験では、Stable Diffusion、Kandinsky、Midjourney など、最新の7つのLDMに対して高い検出精度(平均精度0.992)を示した。また、再構成誤差のマップを使って、実画像内の修正領域を特定できることも示した。
本手法は、LDMで生成された画像の検出に有効な新しいアプローチであり、訓練不要で高精度な検出が可能で、さらに生成画像の分析にも活用できる。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor