本論文は、近傍区間摂動融合(NIDF)に基づく新しい教師なし特徴選択アルゴリズムフレームワークを提案している。このフレームワークは、データセットの各サンプルおよび特徴を、その近傍のサンプルや特徴を用いて区間で近似することで、外れ値の影響を軽減し、より安定した特徴選択を実現する。
まず、NIDFは与えられたデータセットを、各サンプルおよび特徴の近傍情報を用いて区間で近似することで、4つの近似データセットを生成する。具体的には、各サンプルに対してK近傍法を用いて近傍サンプルを見つけ、それらの値のばらつきを考慮して区間を決定する。特徴についても同様の処理を行う。
次に、NIDFは生成された4つの近似データセットに対して、既存の教師なし特徴選択アルゴリズム(LapScore、MCFS、KLMFSなど)を適用し、それぞれの特徴に対するスコアを計算する。最後に、これらのスコアと近似データ区間の両方を考慮した統合学習を行い、最終的な特徴スコアを決定する。
提案手法の有効性を検証するため、8つの公開データセットを用いて実験を行った。その結果、NIDFを用いることで、従来の教師なし特徴選択アルゴリズムと比較して、クラスタリング精度が最大で約17%向上することが確認された。また、既存の教師なし特徴選択アルゴリズムの後処理として広く用いられているGRMやAGRMと比較しても、多くの場合で優れた性能を示した。
本論文で提案されたNIDFは、区間近似を用いることで、教師なし特徴選択アルゴリズムの精度と安定性を向上させることができる。このフレームワークは、様々な教師なし特徴選択アルゴリズムに適用可能であり、高次元データからの効果的な特徴抽出に貢献するものである。
他の言語に翻訳
原文コンテンツから
arxiv.org
抽出されたキーインサイト
by Xiaolin Lv, ... 場所 arxiv.org 10-22-2024
https://arxiv.org/pdf/2410.15294.pdf深掘り質問