本論文では、個人情報を保護しつつ、共分散行列が未知の状況下で平均を効率的に推定する2つの手法を提案している。
1つ目の手法は、Tukey深度を用いた手法である。Tukey深度は多変量データの中心性を表す指標で、ガウス分布の平均に近い点ほど深度が高くなる。提案手法では、Tukey深度が一定以上の点のみからサンプリングを行うことで、平均に近い点を効率的に見つけられる。さらに、プライバシーを保護するために、データセットが「安全」かどうかを事前にプライベートに確認する処理を加えている。この手法は、ガウス分布に対して最適なサンプル複雑度を達成する。
2つ目の手法は、経験共分散行列を用いて平均を推定する手法である。具体的には、経験平均に経験共分散行列に基づいて較正したノイズを加えることで、平均を推定する。この手法は、共分散行列の事前情報を必要とせず、より一般的な分布クラス(サブガウス分布)に対しても良好な性能を示す。
両手法とも、プライバシーを保護しつつ、平均を効率的に推定できることが理論的に保証されている。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Gavin Brown,... ב- arxiv.org 03-27-2024
https://arxiv.org/pdf/2106.13329.pdfשאלות מעמיקות