核心概念
特徴選択は、ノックオフ特徴を活用し、強化学習によって最適な効果的な特徴サブセットを識別する革新的なフレームワークを紹介します。
要約
AIの準備を整えるために冗長な特徴を排除することでデータのAI対応を行う。これまでの研究は主に2つの主要カテゴリーに分かれており、監督された特徴選択(SFS)と非監督された特徴選択(UFS)がある。SFSアプローチは時間がかかり、ターゲット変数や下流MLタスクへの依存性から異なるシナリオで一般化しづらい。UFSメソッドは削減された特徴空間が潜在的で追跡不可能であるという制約がある。この課題に対処するため、ノックオフ特徴によってガイドされ、強化学習を通じて最適かつ効果的な特徴サブセットを識別する革新的なフレームワークが導入されました。この手法では、「ノックオフ」特徴を生成し、元の特徴と同じ分布や特性を複製しますが、ターゲット変数とは無関係です。各特徴はその他すべてのノックオフ特徴との相関に基づいて擬似ラベルが割り当てられます。これらの擬似ラベルを使用して3つの新しい方法で特徴選択プロセスをガイドし、単一強化エージェントによって最適化されます。
統計
特定カテゴリー: 機械学習
主要カテゴリー: 特徴選択手法
26種類のデータセットから得られた結果
引用
"Feature selection prepares the AI-readiness of data by eliminating redundant features."
"Our approach utilizes these pseudo labels to guide the feature selection process in three novel ways, optimized by a single reinforced agent."
"The code and data are publicly available at the provided link."