Core Concepts
MNAR 標本選択バイアスを持つデータにおいて、予測特徴量を適切に選択することで、ロバストな回帰モデルを構築できる。
Abstract
本研究では、MNAR 標本選択バイアスを持つデータに対して、Heckman 選択モデルを用いてロバストな回帰モデルを構築する手法を提案している。
具体的には以下の3つのステップから成る:
割り当て関数ψを学習し、各選択特徴量が予測特徴量として割り当てられる確率を推定する。
推定された割り当て確率に基づいて、予測特徴量を抽出する。この際、予測モデルの適合度と予測・選択方程式の誤差項の相関を考慮する。
抽出された予測特徴量を用いて、Heckman 選択モデルを実行し、ロバストな回帰モデルを構築する。
提案手法は、実データセットを用いた実験で、他の回帰手法と比較して優れた性能を示した。
Stats
MNAR 標本選択バイアスを持つデータにおいて、提案手法のテストMSEは、単純な線形回帰よりも0.0009低く、RU回帰よりも0.0027低かった。
提案手法のテストMSEは、CRIME データセットで0.0203、COMPAS データセットで0.2504であった。
Quotes
"MNAR 標本選択バイアスを持つデータにおいて、予測特徴量を適切に選択することで、ロバストな回帰モデルを構築できる。"
"提案手法は、実データセットを用いた実験で、他の回帰手法と比較して優れた性能を示した。"