本論文では、大規模データセットに対する特徴量選択の計算コストを削減するために、2段階のサロゲート支援進化計算アプローチを提案している。
まず、データインスタンスの能動的選択により、軽量な定性的近似モデルを構築する。この近似モデルは、元の評価関数との順位相関が高く、進化計算の正しい収束を保証する。
次に、この近似モデルを使用して遺伝的アルゴリズムによる特徴量選択を行う。元の評価関数との比較を定期的に行うことで、近似モデルの収束を防ぐ。
実験の結果、提案手法であるCHC𝑄𝑋は、大規模データセットにおいて、従来のCHCアルゴリズムよりも高速に収束し、より高精度の特徴量部分集合を見つけられることが示された。また、別の進化計算手法であるPSOにも同様のアプローチを適用したPSO𝑄𝑋も良好な結果を示した。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問