核心概念
提案されたC-XGBoostモデルは、XGBoostアルゴリズムの強力な予測能力と、因果推論ニューラルネットワークモデルが両処理群の結果を推定するのに有用な表現を学習する特性を活用することで、因果効果の推定に優れた性能を発揮する。
要約
本研究では、因果効果推定のための新しいツリーベースのモデルであるC-XGBoostを提案した。提案アプローチの主な着想は、XGBoostアルゴリズムの強力な予測能力と、因果推論ニューラルネットワークモデルが両処理群の結果を推定するのに有用な表現を学習する特性を活用することである。
提案モデルの主な利点は以下の通り:
欠損値を効率的に処理でき、前処理の手間が最小限で済む
オーバーフィッティングやバイアスを回避するための正則化手法を備えている
また、提案モデルの効率的な学習のために新しい損失関数を提案した。
提案モデルは、ツリーベースおよびニューラルネットワークベースの最先端の因果推論モデルと比較して、2つの半合成データセットコレクションで優れた性能を示した。統計的分析からも、提案モデルの有効性と正確性が実証された。
統計
処理群と対照群の潜在的結果の差の絶対誤差|ϵATE|は、提案モデルC-XGBoostが最も良好な性能を示した。
異質的処理効果の推定精度(PEHE)においても、C-XGBoostが最も優れた効率性と頑健性を示した。