核心概念
本稿では、不完全なデータセットから欠損値を推論するための新しい因果関係に基づく補完推定器であるGSIを提案する。GSIは、既存の推定器であるSI-AおよびSI-Cを拡張したものであり、より複雑な潜在因子モデルを採用することで、出力の各次元における固有の違いを考慮している。
本論文は、不完全なデータセットにおける欠損値を推定する問題に取り組む、新規な因果推論に基づく補完推定器であるGSI (Generalized Synthetic Interventions) を提案する。これは、Squires et al. (2022) によって提案された既存の推定器であるSI-AおよびSI-Cを拡張したものであり、より複雑な潜在因子モデルを採用することで、出力の各次元における固有の違いを考慮している。
科学において、テスト済みの相互作用からテストされていない相互作用の結果を決定する問題は、遍在している。考えられるすべての相互作用を評価することは、多くの場合、法外に費用がかかるか (例:何千もの化合物の数十種類の細胞型への影響を調べる)、倫理的に問題がある (例:新しい患者グループへの薬の投与)。この行列補完問題 (教師なし機械学習においてますます重要になっている) に対するアプローチは多数あるが、これらの相互作用の因果構造に関する何らかの仮定を利用する方法は、因果関係に基づく補完を実行すると考えられている (Squires et al. 2022)。