本論文では、トレーニングデータの正確な複製を防ぐための新しい手法であるCPSampleを提案する。CPSampleは、トレーニングデータにランダムなラベルを割り当て、そのラベルを予測する分類器を訓練する。この分類器を用いて、生成プロセス中にトレーニングデータに近い領域からサンプリングされないよう誘導する。
具体的には以下の手順で行う:
理論的な分析から、CPSampleはリジェクションサンプリングと同様の保証を提供することが示される。また、実験結果から、CPSampleはトレーニングデータの類似性を大幅に低減しつつ、画質の劣化を最小限に抑えられることが確認された。さらに、メンバーシップ推論攻撃に対する頑健性も示された。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Joshua Kazda... ב- arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.07025.pdfשאלות מעמיקות