核心概念
在高維度資料中估計個人化治療規則時,沒有一種方法能在準確性、可解釋性和計算效率方面都優於其他方法,需要根據實際情況進行取捨。
摘要
高維度資料中個人化治療規則估計的指引與模擬研究:兼論治療效果調節變數重要性參數之應用
這篇研究論文探討在高維度資料中估計個人化治療規則 (ITR) 的挑戰,並提供相關指引。研究指出,沒有一種 ITR 估計方法能夠同時滿足準確性、可解釋性和計算效率等所有需求,因此需要根據實際情況進行取捨。
問題背景
臨床試驗的目標是評估新療法的效果和安全性,傳統上通過分析邊際參數(如平均治療效果)來評估療效。
個性化醫療的興起強調根據患者特徵制定治療決策,以優化治療結果。
個體化治療規則 (ITR) 可用於識別治療效果調節變數 (TEMs),並根據患者特徵預測治療效果。
挑戰
在高維度資料(預處理協變數數量多於觀察值)中估計 ITR 具有挑戰性。
現有 ITR 估計方法在高維度資料中的表現尚未得到充分評估。
方法
研究比較了多種 ITR 估計方法,包括參數化方法和非參數化方法。
評估指標包括準確性、可解釋性和計算效率。
提出基於治療效果調節變數重要性參數 (TEM-VIP) 的預處理協變數過濾方法,以提高估計器的準確性和可解釋性。
模擬研究
使用 16 種不同的資料生成過程 (DGP) 進行模擬研究,涵蓋連續型結果變數、二元治療變數和高維度協變數。
比較了不同 ITR 估計方法在不同 DGP 和樣本大小下的表現。
結果
沒有單一 ITR 估計方法在所有情況下都表現最佳。
基於 LASSO 的插件估計器在準確性和計算效率方面表現出色,但可解釋性較差。
非參數化方法(如基於 AIPW 的估計器)在準確性和可解釋性方面表現良好,但計算效率較低。
TEM-VIP 過濾方法可以提高 ITR 估計器的準確性和可解釋性,但會增加計算成本。
結論
在高維度資料中估計 ITR 需要在準確性、可解釋性和計算效率之間進行權衡。
研究結果為實務工作者選擇 ITR 估計方法提供了指引。
未來研究方向包括開發更有效率的 TEM-VIP 估計方法和評估其他 ITR 估計方法。