本論文は、高次元データに対する差分プライバシー保護近似最近傍カウンティング問題を扱っている。
まず、近似最近傍検索(ANN)のための簡単な線形空間データ構造であるTop-1を提案する。Top-1は、ガウシアンベクトルを用いて各データ点を1つのバケットに割り当て、クエリ時にそれらのバケットを調べることで近似最近傍を見つける。
次に、Top-1のカウンティング版であるANNCを提案する。ANNCでは、各バケットの大きさを記録するだけで、差分プライバシーを保証しつつ近似最近傍カウンティングを実現できる。
さらに、Top-1の改良版であるCloseTop-1を提案する。CloseTop-1では、各データ点をより期待値に近いガウシアンベクトルに割り当てることで、Top-1の性能を改善する。
最後に、TensorCloseTop-1を提案し、前処理時間をO(d·n^(1+o(1)))、空間をO(d·n)、クエリ時間をO(d·n^(ρ+o(1)))まで改善する。
全体として、本論文は、差分プライバシー保護下での高次元近似最近傍カウンティングに対して、単純で効率的なデータ構造を提案している。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies