既存のキャリブレーション指標は、予測の真実性を適切に評価できない場合があり、予測モデルがシステムを悪用することを許してしまう可能性がある。本論文では、サンプリングに基づく新たな指標を提案し、その有効性を示す。