核心概念
本文提出了一種新的統計方法,用於增強混合對照試驗的統計有效性和效力,特別是在樣本量較小的情況下。該方法結合了隨機推斷和共形選擇性借用,可以有效地控制第一類錯誤率,並提高統計效力。
書目信息
Ke Zhu, Shu Yang, and Xiaofei Wang. (2024). Enhancing Statistical Validity and Power in Hybrid Controlled Trials: A Randomization Inference Approach with Conformal Selective Borrowing. arXiv preprint arXiv:2410.11713v1.
研究目標
本研究旨在解決混合對照試驗中,特別是當隨機對照試驗 (RCT) 樣本量較小時,如何有效控制第一類錯誤率並提高統計效力的問題。
方法
研究人員提出了一種結合了隨機推斷和共形選擇性借用的新方法。該方法首先使用雙重穩健估計器來估計平均治療效果,然後使用 Fisher 隨機檢驗 (FRT) 進行推斷。為了減輕外部控制組 (EC) 中潛在偏差的影響,研究人員引入了共形選擇性借用,使用共形 p 值來選擇性地納入無偏差的 EC。
主要發現
FRT 能夠在各種情況下嚴格控制第一類錯誤率,即使在 EC 存在偏差的情況下也是如此。
納入無偏差的 EC 可以顯著提高 FRT 的效力。
共形選擇性借用可以有效地識別和排除有偏差的 EC,從而提高 FRT 在存在偏差情況下的效力。
主要結論
該研究提出了一種強大的統計框架,用於分析混合對照試驗,特別適用於 RCT 樣本量較小的情況。通過結合 FRT 和共形選擇性借用,該方法確保了嚴格的類型 I 錯誤控制,並提高了統計效力。
意義
這項研究對罕見疾病或參與率較低的常見疾病的藥物評估具有重要意義。它為混合對照試驗提供了可靠且有效的方法,可以提高統計 rigor 並最大程度地利用 RCT 和外部數據源。
局限性和未來研究方向
該研究主要集中在平均治療效果的估計上。未來可以探索將該方法擴展到其他效應指標,例如風險比或風險差異。
共形選擇性借用的性能取決於共形分數函數的選擇。未來可以研究不同分數函數的影響,並開發數據驅動的方法來選擇最佳函數。
統計資料
隨機對照試驗 (RCT) 的樣本量為 (n1, n0, nE) = (50, 25, 50)。
外部控制組 (EC) 的樣本量也考慮了較大的規模 (nE = 300)。
協變量 X 服從均值為 0,協方差矩陣為單位矩陣 Ip 的 p 維正態分佈,其中 p = 2。
採樣指標 S 服從伯努利分佈,其概率由邏輯函數 π(X) = {1 + exp (η0 + XTη)}−1 決定,其中 η0 的選擇確保 E(S) = nR/N,η = (0.1, 0.1)。
對於 RCT 樣本 (S = 1),潛在結果 Y (0) = XTβ0 +ε,其中 β0 = (1, 1),Y (1) = 0.4 + XTβ1 + ε,其中 β1 = (2, 2),ε 服從標準正態分佈。
對於 EC 樣本 (S = 0),考慮了兩種情況:(i) 無隱藏偏差的情況,其中 Y (0) = XTβ0+0.5ε; (ii) 部分 EC 存在隱藏偏差 b 的情況,其中 ρ 比例的 EC 存在偏差,其潛在結果為 Y (0) = −b + XTβ0 + 0.5ε,其餘 (1 −ρ) 比例的 EC 無偏差,其潛在結果為 Y (0) = XTβ0 + 0.5ε。
偏差 EC 的比例 ρ 設定為 50%,隱藏偏差 b 的大小設定為 1, 2, . . . , 8。
使用了四種估計 τ 的方法:不借用 (NB)、完全借用 (FB)、共形選擇性借用 (CSB) 和自適應 Lasso 選擇性借用 (ALSB)。
對於 CSB,使用了四種選擇閾值:γ = 0.4、0.6、0.8 和 γadaptive。
Fisher 隨機檢驗 (FRT) 的重複次數設定為 B = 5000。
每次模擬重複 500 次。