Core Concepts
Stable Diffusionモデルに訓練を施すことなく、潜在空間にウォーターマークを埋め込むことで、高品質な画像生成と追跡可能性を両立させる。
Abstract
本研究では、Stable Diffusion (SD)モデルに対して訓練不要のプラグアンドプレイ型ウォーターマーク・フレームワークを提案している。従来のウォーターマーク手法は、SDモデルの一部または全体を再訓練する必要があり、SDのバージョンアップに追従するのが困難であった。
提案手法では、SDのVAEエンコーダ・デコーダの一部を利用してウォーターマーク符号化・復号化モデルを訓練し、SDの潜在空間にウォーターマークを埋め込むことで、SDの再訓練を必要としない。これにより、SDの様々なバージョンに対して汎化性を発揮する。
具体的には以下の通り:
ウォーターマーク符号化・復号化モデルを訓練し、SDの潜在空間にウォーターマークを埋め込む
潜在空間への埋め込み位置を最適化し、画質と抽出精度のバランスを取る
様々な攻撃に対するロバスト性を確保
複数のSDバージョンに対して汎化性を実証
本手法は、SDの高品質な画像生成と追跡可能性を両立させる実用的で効率的なソリューションを提供する。
Stats
生成画像の平均PSNR値は36.93dB以上を達成し、高品質な視覚効果を実現している。
ウォーターマークの正規化相関係数は96%以上を示し、ウォーターマークの抽出精度が高い。
ウォーターマークの文字編集率は13%~15%であり、ほとんどの文字が正しく抽出されている。