核心概念
トレーニングデータの正確な複製を防ぐために、分類器ガイダンスを用いてサンプリングプロセスを修正する。
要約
本論文では、トレーニングデータの正確な複製を防ぐための新しい手法であるCPSampleを提案する。CPSampleは、トレーニングデータにランダムなラベルを割り当て、そのラベルを予測する分類器を訓練する。この分類器を用いて、生成プロセス中にトレーニングデータに近い領域からサンプリングされないよう誘導する。
具体的には以下の手順で行う:
- トレーニングデータにランダムなバイナリラベルを割り当て、それを予測する分類器を訓練する。
- サンプリング時に、分類器が高い確率でトレーニングデータに近いと判断したサンプルについて、生成プロセスを修正する。具体的には、分類器の勾配を用いてサンプルを反対のラベルに近づけるよう調整する。
- これにより、トレーニングデータの正確な複製を防ぐことができる。また、リジェクションサンプリングと同様の効果を持ちつつ、リサンプリングの必要がない。
理論的な分析から、CPSampleはリジェクションサンプリングと同様の保証を提供することが示される。また、実験結果から、CPSampleはトレーニングデータの類似性を大幅に低減しつつ、画質の劣化を最小限に抑えられることが確認された。さらに、メンバーシップ推論攻撃に対する頑健性も示された。
統計
トレーニングデータに近い生成画像の割合は、DDIM(無防護)では6.25%だったのに対し、CPSample(α=0.001)では0.00%に減少した。
CelebA-64データセットでは、DDIM(無防護)が12.5%だったのに対し、CPSample(α=0.001)は0.10%に減少した。
LSUN Churchデータセットでは、DDIM(無防護)が0.73%だったのに対し、CPSample(α=0.1)は0.04%に減少した。