核心概念
本稿では、観測データから因果関係を推論する新しい機械学習手法「メカニズム学習」を提案する。これは、複数の未知の交絡因子がある場合でも、フロントドア因果ブートストラップを用いることで、効果から原因を予測する逆因果推論を可能にする。
要約
メカニズム学習:フロントドア因果ブートストラップによる、複数の未知の交絡因子存在下における逆因果推論
本研究は、機械学習モデルが観測データから因果関係ではなく相関関係を学習してしまう問題に取り組む。特に、医療診断などの重要な意思決定に機械学習を応用する際に、この「因果関係の盲点」が問題となる。本研究では、複数の未知の交絡因子が存在する場合でも、観測データから因果関係を推論できる新しい機械学習手法「メカニズム学習」を提案する。
メカニズム学習は、フロントドア因果ブートストラップを用いて観測データを脱交絡化し、教師あり学習モデルが効果と原因の関係を学習できるようにする。この手法は、効果変数が非常に高次元で、予測関係が非線形である場合でも適用可能である。
フロントドア因果ブートストラップ: 観測データから介入分布を推定するために、do計算とRKHSベースのKDEを用いて、特徴データと予測ターゲット間の直接的な因果パスからブートストラップを行う。
メカニズム変数の埋め込み: 高次元のメカニズム変数(例:出血領域のラベル)を低次元表現に埋め込むために、ResNetベースのエンコーダ・デコーダモデルを使用する。
脱交絡化データの生成: フロントドア因果ブートストラップを用いて、交絡因子を含まない模擬データを生成する。
機械学習モデルの学習と評価: 脱交絡化データを用いて教師あり学習モデルを学習し、交絡データと脱交絡データの両方でその性能を評価する。