核心概念
医療診断におけるマシンラーニングモデルの説明能力を評価し、人間の専門知識と整合性のある最適なモデルを選択することが重要である。
要約
本研究では、膵臓がんの治療に関する意思決定を支援するためのマシンラーニングモデルの説明能力を評価しています。
専門家による特徴量選択プロセスを通じて、27の特徴量を抽出しました。これらの特徴量は、推奨セット、最大セット、最小セットの3つのグループに分類されています。
決定木、ランダムフォレスト、XGBoostの3つのマシンラーニングモデルを構築し、それぞれの精度を評価しました。
各モデルの説明能力を評価するために、特徴量重要度を表す手法(MDI、MDA、SHAP、LIME)を適用しました。
医療ガイドラインと専門家の意見を基準として、各モデルの説明能力を比較・検討しました。
最小特徴量セットを使用したモデルが最も高い精度と説明能力を示しました。これは、過剰な特徴量の追加が必ずしも精度向上につながらないことを示唆しています。
専門家の知識を取り入れることで、より解釈可能性の高いモデルを構築できることが示されました。
統計
年齢は35歳から88歳の範囲にある。
腫瘍の大きさ(T)は、TX、T1、T2、T3、T4の5つのカテゴリーに分類される。
リンパ節転移(N)は、N0、N1、N1b、NXの4つのカテゴリーに分類される。
遠隔転移(M)は、M0、M1、MXの3つのカテゴリーに分類される。
がんのステージは、Stage 0、Stage I(IA、IB)、Stage II(IIA、IIB)、Stage III、Stage IVの5つのカテゴリーに分類される。