Core Concepts
変数順序は、一般的に使用されている構造学習アルゴリズムの精度に大きな影響を与える。
Abstract
本研究では、離散カテゴリカルデータを使用したベイジアンネットワークの構造学習において、データ内の変数順序が学習精度に及ぼす影響を調査しました。
主な結果は以下の通りです:
一般的に使用されている近似スコアベースのアルゴリズム(ヒルクライミングなど)は、変数順序の影響を大きく受けます。この影響は、サンプルサイズ、目的関数、ハイパーパラメータの変更による影響よりも大きいことがわかりました。
ハイブリッドアルゴリズムや制約ベースのアルゴリズムも、変数順序の影響を受けますが、その影響は相対的に小さいです。
ヒルクライミングアルゴリズムの学習過程を詳しく分析したところ、初期の任意の辺の追加や反転が、最終的な学習精度に大きな影響を及ぼすことがわかりました。
これらの結果は、多くの構造学習アルゴリズムの妥当性評価において、変数順序の影響が過小評価されていることを示唆しています。変数順序は、他の要因よりも学習精度に大きな影響を及ぼすため、アルゴリズムの性能評価や実用的な応用においてこの点を考慮する必要があります。
Stats
変数順序を最適から最悪に変更すると、F1スコアが平均0.412改善される。
変数順序を英字順から最適に変更すると、F1スコアが平均0.215改善される。