核心概念
従来のp値は選択的推論においても有用であり、統一的な枠組みを提供することで、様々な選択的推論問題に適用可能である。
要約
選択的推論におけるp値の有用性
本論文は、データ依存的な選択の後でも有効な推論を可能にする統計学の一分野である選択的推論に関するものです。従来、選択的推論は選択イベントの条件付けによって行われてきましたが、その導出や実装の難しさ、直感的ではない振る舞いなどが課題となっていました。
本論文では、p値を中心とした選択的推論の統一的な枠組みを提案しています。この枠組みでは、「選択的に優位なp値」という新しい概念を導入し、任意の選択手順の後でも容易に有効な仮説検定と信頼区間を提供できることを示しています。
従来のp値は、帰無仮説の下で一様分布を確率的に優位にしますが、選択的に優位なp値は、選択後の分布が、同じ選択プロセスを経た一様分布の分布を確率的に優位にする必要があります。さらに、この性質は、すべての可能な選択プロセスに対して同時に成り立つ必要があります。
驚くべきことに、一般的に使用される多くのp値(例えば、パラメトリックファミリーにおける両側検定、単調尤度比と指数型分布族における片側検定、線形回帰のF検定、並び替え検定など)は、選択的に優位であることが示されています。
本論文では、選択的優位性の枠組みを用いて、2つの典型的な選択的推論問題、すなわち「勝者の推論」と「ランク検証」を再解釈することで、よりシンプルな導出、より深い概念理解、そしてこれらの手法の新しい一般化とバリエーションを提供しています。
勝者の推論
勝者の推論は、複数の観測値の中から最も優れたもの(勝者)を選び、その勝者の母集団に関する推論を行う問題です。本論文では、選択的に優位なp値を用いることで、勝者の母数の信頼区間を簡単に構成できることを示しています。
ランク検証
ランク検証は、2つの母集団から得られたデータに基づいて、どちらの母集団が優れているかを判定する問題です。本論文では、選択的に優位なp値を用いることで、ランク検証をより一般的に行うことができることを示しています。