Grunnleggende konsepter
観測データに基づいて、既存の意思決定ポリシーと新しい意思決定ポリシーの予測性能を比較する方法を提案する。
Sammendrag
本論文では、既存の意思決定ポリシーと新しい意思決定ポリシーの予測性能を比較する方法を提案している。
まず、観測データから得られる情報と未観測の交絡要因に基づいて、各ポリシーの性能指標を部分同定する。次に、ポリシー間の性能差を表す「δ-regret」を直接的に評価する手法を開発する。これにより、従来の方法よりも情報的な性能比較区間を得ることができる。
具体的には以下の手順で進める。
- 観測データから得られる情報と未観測の交絡要因に基づいて、各ポリシーの性能指標(正解率、精度、F値など)を部分同定する。
- ポリシー間の性能差を表す「δ-regret」を直接的に評価する手法を開発する。これにより、従来の方法よりも情報的な性能比較区間を得ることができる。
- 提案手法の有効性を理論的に示し、シミュレーション実験とリアルワールドの事例で検証する。
本手法は、医療、教育、司法など、高リスクな意思決定場面でのポリシー評価に活用できる。
Statistikk
既存ポリシーの選択確率p(D=1|X=x)は観測データから推定できる。
新ポリシーの選択確率p(T=1|X=x)は事前に知られている。
未観測の交絡要因U に関する情報は限られているが、ある種の因果関係仮定(IV、MSM、Rosenbaum's Γ)から部分同定できる。
Sitater
"Predictive models are often introduced under the rationale that they improve performance over an existing decision-making policy."
"Given the high-stakes nature of these domains, regulatory frameworks have called for organizations to provide explicit comparisons of predictive models against the status quo they are intended to replace."