核心概念
任意の多項式時間で決定可能な分布特性について、検証者が少ないサンプル数と計算リソースで近似的に正しいことを確認できる対話型の議論システムを提案する。
摘要
本論文では、統計分析の結果の正確性を確保する方法について検討している。特に、未知の分布に関する特性を検証する問題に焦点を当てている。
まず、検証者と不正な証明者の間の対話型プロトコルを提案する。このプロトコルを使うと、多項式時間で決定可能な任意の分布特性について、検証できる。分布が特性から遠い場合、検証者は高確率で拒否する。この健全性は、標準的な暗号学的仮定の下で成り立つ。
提案するプロトコルの特徴は以下の通り:
- ドメインサイズNに対して、通信量と検証者のサンプル数・計算時間は eO(√N/ε^2)
- 多くの自然な特性では、単独で分析を行うよりも二乗の高速化が実現できる
- 完全に信頼できない証明者でも、効率的に検証可能
さらに、提案手法は以下の拡張も可能:
- 単調分布、junta分布などの特性の容認的検証
- 機械学習アルゴリズムの検証
- NP判定可能な特性への適用
全体として、本論文は、分布特性の効率的な検証手法を提案し、その応用範囲を示したものである。
统计
分布Dが特性Πから距離εf以上離れている場合、多項式時間の不正な証明者でも検証者を受け入れさせる確率は無視できる小さい。
提案プロトコルの通信量、検証者のサンプル数・計算時間は eO(√N/ε^2) · poly(κ)である。
正直な証明者のサンプル数は eO(N) · poly(1/ρ)、計算時間は poly(N, κ)である。