核心概念
サンプルサイズが変数数に比べて小さい場合でも、分布や構造に関する強い仮定なしに、大規模な因果ポリツリーを高精度で推定できるアルゴリズムを提案する。
要約
本論文では、変数数が標本サイズに比べて非常に大きい状況でも、因果ポリツリーの構造を高精度で推定できるアルゴリズムを提案している。
アルゴリズムは2つのステップから成る:
- スケルトンの推定
- 変数間の相関係数ξを使って、変数間の関係を表すグラフを構築する。
- この無向グラフの最大重み spanning forest をスケルトンの推定値とする。
- 矢印の向きの推定
- 変数間の条件付き相関係数τを使って、スケルトンの各辺の向きを決定する。
- 向きが決まっていない辺については、根付き木の構造を仮定して向きを決める。
理論的には、変数が非定数で相互に依存し、相関係数が一定の下限を下回らない条件の下で、提案アルゴリズムが正しい因果ポリツリーを高確率で復元できることを示している。
シミュレーション結果からも、変数数が標本サイズを大幅に上回る状況でも、提案手法が良好な推定精度を示すことが確認された。
統計
変数数が1023、標本サイズが300の場合、線形ツリーとバイナリツリーでは、スケルトンの辺の90%以上、方向の辺の85%以上が正しく推定された。