Concetti Chiave
多目的最適化における過大評価を調整するDOSA-MOアルゴリズムは、バイオマーカー選択プロセスの性能を向上させることが示されました。
Sintesi
機械学習を用いたバイオマーカー発見における課題は、分子特徴が豊富でサンプルが不足していることです。特徴選択方法は、モデルのパフォーマンスを最適化するために複数の特徴セット(モデル)を評価する必要があります。DOSA-MOは、モデルのパフォーマンス推定値、その分散、および解決策の特徴量サイズがどれだけ過大評価を予測するかを学習し、期待されるパフォーマンスを調整します。この手法は、3つのトランスクリプトミクスデータセットを使用して腎臓および乳がんの癌サブタイプや患者全体生存率を予測する際に、最先端の遺伝的アルゴリズムのパフォーマンス向上を確認しました。
Statistiche
バイオインフォマティクスで使用される3つのトランスクリプトミクスデータセット
NSGA3-CHS GAによる最新技術の改善結果
Citazioni
"Most feature selection methods in machine learning require evaluating various sets of features (models) to determine the most effective combination."
"Evaluations have performance estimation error and when the selection involves many models the best ones are almost certainly over-estimated."
"We propose DOSA-MO, a novel multi-objective optimization wrapper algorithm that learns how the original estimation, its variance, and the feature set size of the solutions predict the overestimation."