本論文では、適応的データ分析の文脈において、サブサンプリングが有効であることを示している。
主な内容は以下の通り:
サブサンプリングを行うクエリを定義し、その性質を分析する。具体的には、サブサンプリングクエリの平均leave-many-outKL安定性を示す。
サブサンプリングクエリの平均leave-many-outKL安定性と相互情報量の関係を明らかにし、サブサンプリングクエリの応答が元の分布を良く近似することを示す。
上記の結果を用いて、統計的クエリと中央値推定の2つのタスクに対して、単純かつ高精度なメカニズムを提案する。
特に、統計的クエリに対するメカニズムは、従来手法と比べて、より小さなサンプルサイズで高精度な応答が得られる。また、実装が極めて簡単であるという利点もある。
全体として、適応的データ分析の文脈において、サブサンプリングが有効な手法であることを理論的に示した点が本論文の主要な貢献である。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問