核心概念
本研究では、層化無作為抽出法の下で、差分プライバシーを満たしつつ母集団割合の信頼区間を構築する手法を提案する。層化サンプリングのデータに適した2つの差分プライバシーの概念を定義し、ノイズ付加の方法の違いによる3つのアルゴリズムを開発した。理論的な解析により、提案手法が所望のプライバシー水準と漸近的な信頼水準を満たすことを示した。
摘要
本研究では、層化無作為抽出法の下で母集団割合の信頼区間を差分プライバシーを満たしつつ構築する手法を提案している。
まず、層化サンプリングのデータに適した2つの差分プライバシーの概念を定義した。1つは標本サイズが公開されている場合の「同一層内での置換」、もう1つは標本サイズが非公開の場合の「追加/削除」である。
次に、これらの差分プライバシーの概念に基づき、3つのアルゴリズムを提案した。
- 層レベルでノイズを付加するアルゴリズム(StrNz-PubSz)
- 母集団レベルでノイズを付加するアルゴリズム(PopNz-PubSz)
- 層レベルでノイズを付加し、標本サイズも非公開にするアルゴリズム(StrNz-PrivSz)
理論的な解析により、これらのアルゴリズムがそれぞれ所望のプライバシー水準と漸近的な信頼水準を満たすことを示した。また、アルゴリズム間の分散の比較も行った。
統計資料
層hにおける標本割合の非プライバシー推定量の分散は
Nh −nh
Nh
ˆ
ph(1 −ˆ
ph)
nh −1
である。
層hにおける標本割合の差分プライバシー推定量の分散は
Nh −˜
nh
Nh −1
˜
ph(1 −˜
ph)
˜
nh
1
2ρ1˜
n2
h
+
˜
p2
h
2ρ2˜
n2
h
である。