Core Concepts
多くの方法が差分プライバシーを考慮したモデルトレーニングに依存しており、公開または合成データとプライベートデータの間の類似性を計算することが重要である。
Abstract
プライバシー保護が重要であり、差分プライバシー(DP)フレームワークが採用されている。
DP要件とMLモデルのパフォーマンスを調整するために多くの手法が提案されている。
本研究では、プライベートデータセットへの類似性計算を抽象化し、基本的なアルゴリズム問題を考察している。
カーネル関数や距離関数などさまざまな場合について、理論的結果が改善されており、広範囲のカーネルや距離関数に対するより良いプライバシーと効用のトレードオフが提供されている。
アルゴリズムは実験的にも改善されており、従来の最先端技術よりもクエリ時間と精度が向上している。
Stats
Many methods in differentially private model training rely on computing the similarity between a query point (such as public or synthetic data) and private data.
Our theoretical results improve upon prior work and give better privacy-utility trade-offs as well as faster query times for a wide range of kernels and distance functions.