Core Concepts
共分散を知らずに、効率的に平均を推定する2つの手法を提案する。1つ目は、Tukey深度を用いて平均に近い点をプライベートにサンプリングする手法で、ガウス分布に対して最適なサンプル複雑度を達成する。2つ目は、経験共分散行列を用いて平均を推定する手法で、より一般的な分布クラスに対して良好な性能を示す。
Abstract
本論文では、個人情報を保護しつつ、共分散行列が未知の状況下で平均を効率的に推定する2つの手法を提案している。
1つ目の手法は、Tukey深度を用いた手法である。Tukey深度は多変量データの中心性を表す指標で、ガウス分布の平均に近い点ほど深度が高くなる。提案手法では、Tukey深度が一定以上の点のみからサンプリングを行うことで、平均に近い点を効率的に見つけられる。さらに、プライバシーを保護するために、データセットが「安全」かどうかを事前にプライベートに確認する処理を加えている。この手法は、ガウス分布に対して最適なサンプル複雑度を達成する。
2つ目の手法は、経験共分散行列を用いて平均を推定する手法である。具体的には、経験平均に経験共分散行列に基づいて較正したノイズを加えることで、平均を推定する。この手法は、共分散行列の事前情報を必要とせず、より一般的な分布クラス(サブガウス分布)に対しても良好な性能を示す。
両手法とも、プライバシーを保護しつつ、平均を効率的に推定できることが理論的に保証されている。
Stats
サンプル数 푛は以下を満たす必要がある:
푛≳
푑
훼2 + 푑
훼휀+ log(1/훿)
휀
ここで、푑は次元数、훼は許容誤差、휀は個人情報保護のパラメータ、훿は失敗確率である。