Kernkonzepte
Generating differentially private synthetic data using foundation model APIs without training.
Zusammenfassung
この論文は、異なるプライベートデータに似た合成データを生成する方法に焦点を当てています。APIを使用してトレーニングせずに差分プライバシーの合成データを生成する手法であるPrivate Evolution(PE)フレームワークを提案しました。PEは、公開された大規模なファウンデーションモデルを活用して高解像度の画像データセットを扱うことが可能であり、既存のSOTAトレーニングベースの手法よりも優れた結果を示すことができます。さらに、PEはAPIアクセスのみで無制限の有用なサンプルを生成する能力も持っています。
Statistiken
CIFAR10(ImageNetが公開データ)でFID≤7.9、プライバシーコストϵ=0.67を達成。
Camelyon17(乳癌転移の分類用医療データセット)でDP合成バージョン(ε=7.58)作成。
100枚の512x512画像から構成される高解像度データセットでも効果的な結果を達成。
Zitate
"Generating differentially private (DP) synthetic data that closely resembles the original private data is a scalable way to mitigate privacy concerns in the current data-driven world."
"PE can match or even outperform state-of-the-art (SOTA) methods without any model training."
"We show that PE not only has the potential to be realized, but also to match or improve SOTA training-based DP synthetic image algorithms despite more restrictive model access."