核心概念
臨床リスク予測モデル構築において、予測精度向上と将来の患者への適用を考慮すると、決定論的補完法が有効であり、ブートストラップ法と組み合わせることで、モデルの性能を効果的に検証できる。
摘要
臨床リスク予測モデルにおける欠損データ補完と内部検証の組み合わせ
書誌情報: Mi, J., Tendulkar, R. D., Sittenfeld, S. M. C., Patil, S., & Zabor, E. C. (2024). Combining missing data imputation and internal validation in clinical risk prediction models. arXiv preprint arXiv:2411.14542v1.
研究目的: 臨床リスク予測モデル構築における、欠損データ処理手法と内部検証の最適な組み合わせを明らかにする。
手法: シミュレーションデータを用い、完全ケース分析と、ブートストラップ法と決定論的補完法を組み合わせたアプローチのバイアスとばらつきを、AUC、Brierスコア、個々の予測確率を用いて比較評価した。
主要な結果: ブートストラップ法と決定論的補完法を組み合わせ、すべての欠損値を補完するアプローチが、AUC、Brierスコア、個々のリスク予測において、最もバイアスの少ない推定結果を示した。完全ケース分析は、欠損データが多い場合、実行不可能な場合もあった。
結論: 臨床リスク予測モデル構築において、決定論的補完法とブートストラップ法を組み合わせることで、欠損データによるバイアスを最小限に抑え、モデルの性能を効果的に検証できる。
意義: 本研究は、臨床リスク予測モデル構築における欠損データ処理のベストプラクティスを提示し、モデルの精度向上に貢献する。
限界と今後の研究: 本研究では、MARの仮定を満たす欠損データのみを扱っており、MNARデータへの対応は今後の課題である。また、外部データを用いた検証も必要である。
本論文は、臨床リスク予測モデルにおける欠損データ処理と内部検証について、詳細な解説とシミュレーション研究に基づいた提言を行っている。
従来の臨床研究では、多重代入法が欠損データ処理のゴールドスタンダードとされてきた。しかし、予測精度と将来の患者への適用可能性を重視する臨床リスク予測モデルにおいては、決定論的補完法が適している。決定論的補完法は、補完モデルにアウトカムを含めないため、将来の患者にも容易に適用可能である。
論文では、ブートストラップ法と決定論的補完法を組み合わせたアプローチを推奨している。ブートストラップ法による内部検証は、変数選択を含むモデル構築プロセス全体を網羅するため、単一のデータセットしか利用できない場合に有効である。
シミュレーション研究の結果、すべての欠損値を補完する決定論的補完法とブートストラップ法を組み合わせたアプローチが、AUC、Brierスコア、個々のリスク予測において、最もバイアスの少ない推定結果を示した。完全ケース分析は、欠損データが多い場合、モデルの収束が困難になるなど、信頼性が低いことが示された。
本論文は、臨床リスク予測モデル構築における欠損データ処理と内部検証の重要性を改めて示し、実務家にとって有用な指針を提供している。