Core Concepts
MMD二標本検定は最適ではなく、スペクトル正則化を用いた提案手法が最小最大最適性を持つ。
Abstract
本論文では、非パラメトリック二標本検定の最適性について検討している。
まず、従来のMMD(最大平均差異)二標本検定は最適ではないことを示した。MMDは確率分布の平均情報しか捉えていないが、分布の共分散情報も重要であることが分かる。
そこで、共分散情報を考慮したスペクトル正則化カーネル二標本検定を提案した。この手法は、最小最大最適性を持つことを理論的に示した。さらに、正則化パラメータの選択を自動化したアダプティブ版の検定も提案し、ログログ因子までの最小最大最適性を示した。
数値実験では、提案手法がMMD検定や他の手法に比べて優れた性能を示すことを確認した。
Stats
MMD検定の分離境界は(N + M)^(-2θ/(2θ+1))であるが、提案手法の分離境界は(N + M)^(-4θβ/(4θβ+1))または√(log(N + M)/(N + M))と、より小さい。
Quotes
"MMDは確率分布の平均情報しか捉えていないが、分布の共分散情報も重要である。"
"提案手法は最小最大最適性を持つ。"
"アダプティブ版の検定はログログ因子までの最小最大最適性を持つ。"