核心概念
スプリットコンフォーマル予測を用いてバッチモードで交換可能なデータを処理する際、未来の観測値のための予測集合の経験的カバレッジの正確な分布を決定することができる。この分布は、公称誤カバレッジレベルとキャリブレーションサンプルサイズのみによって決定される。
摘要
本論文では、スプリットコンフォーマル予測手順によって生成された未来観測値のための予測集合の経験的カバレッジの正確な分布を特定している。また、バッチサイズが無限大に収束するときの経験的カバレッジの正確な分布も特定している。両方の分布は、公称誤カバレッジレベルとキャリブレーションサンプルサイズのみによって決定される普遍的なものである。
この結果は、キャリブレーションサンプルサイズの選択に関する実用的な基準を提供する。具体的には、所望の公称誤カバレッジレベル、許容誤差、および許容確率に基づいて、必要なキャリブレーションサンプルサイズを決定することができる。
统计
未来観測値のための予測集合の経験的カバレッジは、ベータ・バイノミアル分布に従う。
経験的カバレッジの漸近分布は、ベータ分布に従う。
引用
"スプリットコンフォーマル予測は、機械学習分野を点予測から、統計的保証を持つ予測集合によって要約される新しい時代へと移行させつつある。"
"経験的カバレッジの分布の理解は、スプリットコンフォーマル予測の応用において必要なキャリブレーションサンプルサイズを決定するために不可欠である。"