toplogo
登入

增強混合對照試驗的統計有效性和效力:一種基於整合選擇性借用的隨機推斷方法


核心概念
本文提出了一種新的統計方法,用於增強混合對照試驗的統計有效性和效力,特別是在樣本量較小的情況下。該方法結合了隨機推斷和共形選擇性借用,可以有效地控制第一類錯誤率,並提高統計效力。
摘要
edit_icon

客製化摘要

edit_icon

使用 AI 重寫

edit_icon

產生引用格式

translate_icon

翻譯原文

visual_icon

產生心智圖

visit_icon

前往原文

書目信息 Ke Zhu, Shu Yang, and Xiaofei Wang. (2024). Enhancing Statistical Validity and Power in Hybrid Controlled Trials: A Randomization Inference Approach with Conformal Selective Borrowing. arXiv preprint arXiv:2410.11713v1. 研究目標 本研究旨在解決混合對照試驗中,特別是當隨機對照試驗 (RCT) 樣本量較小時,如何有效控制第一類錯誤率並提高統計效力的問題。 方法 研究人員提出了一種結合了隨機推斷和共形選擇性借用的新方法。該方法首先使用雙重穩健估計器來估計平均治療效果,然後使用 Fisher 隨機檢驗 (FRT) 進行推斷。為了減輕外部控制組 (EC) 中潛在偏差的影響,研究人員引入了共形選擇性借用,使用共形 p 值來選擇性地納入無偏差的 EC。 主要發現 FRT 能夠在各種情況下嚴格控制第一類錯誤率,即使在 EC 存在偏差的情況下也是如此。 納入無偏差的 EC 可以顯著提高 FRT 的效力。 共形選擇性借用可以有效地識別和排除有偏差的 EC,從而提高 FRT 在存在偏差情況下的效力。 主要結論 該研究提出了一種強大的統計框架,用於分析混合對照試驗,特別適用於 RCT 樣本量較小的情況。通過結合 FRT 和共形選擇性借用,該方法確保了嚴格的類型 I 錯誤控制,並提高了統計效力。 意義 這項研究對罕見疾病或參與率較低的常見疾病的藥物評估具有重要意義。它為混合對照試驗提供了可靠且有效的方法,可以提高統計 rigor 並最大程度地利用 RCT 和外部數據源。 局限性和未來研究方向 該研究主要集中在平均治療效果的估計上。未來可以探索將該方法擴展到其他效應指標,例如風險比或風險差異。 共形選擇性借用的性能取決於共形分數函數的選擇。未來可以研究不同分數函數的影響,並開發數據驅動的方法來選擇最佳函數。
統計資料
隨機對照試驗 (RCT) 的樣本量為 (n1, n0, nE) = (50, 25, 50)。 外部控制組 (EC) 的樣本量也考慮了較大的規模 (nE = 300)。 協變量 X 服從均值為 0,協方差矩陣為單位矩陣 Ip 的 p 維正態分佈,其中 p = 2。 採樣指標 S 服從伯努利分佈,其概率由邏輯函數 π(X) = {1 + exp (η0 + XTη)}−1 決定,其中 η0 的選擇確保 E(S) = nR/N,η = (0.1, 0.1)。 對於 RCT 樣本 (S = 1),潛在結果 Y (0) = XTβ0 +ε,其中 β0 = (1, 1),Y (1) = 0.4 + XTβ1 + ε,其中 β1 = (2, 2),ε 服從標準正態分佈。 對於 EC 樣本 (S = 0),考慮了兩種情況:(i) 無隱藏偏差的情況,其中 Y (0) = XTβ0+0.5ε; (ii) 部分 EC 存在隱藏偏差 b 的情況,其中 ρ 比例的 EC 存在偏差,其潛在結果為 Y (0) = −b + XTβ0 + 0.5ε,其餘 (1 −ρ) 比例的 EC 無偏差,其潛在結果為 Y (0) = XTβ0 + 0.5ε。 偏差 EC 的比例 ρ 設定為 50%,隱藏偏差 b 的大小設定為 1, 2, . . . , 8。 使用了四種估計 τ 的方法:不借用 (NB)、完全借用 (FB)、共形選擇性借用 (CSB) 和自適應 Lasso 選擇性借用 (ALSB)。 對於 CSB,使用了四種選擇閾值:γ = 0.4、0.6、0.8 和 γadaptive。 Fisher 隨機檢驗 (FRT) 的重複次數設定為 B = 5000。 每次模擬重複 500 次。

深入探究

該方法如何應用於其他類型的臨床試驗,例如集群隨機試驗或階層化試驗?

此方法可以擴展到其他類型的臨床試驗,例如集群隨機試驗或階層化試驗。 集群隨機試驗: 隨機化單元: 在集群隨機試驗中,隨機化的單位是集群而不是個人。我們需要修改 Fisher 隨機化檢驗 (FRT) 的程序,以考慮集群內相關性。這可以通過在置換檢驗過程中保持集群完整性來實現。 共形選擇性借用: 共形選擇性借用仍然適用於選擇無偏差的外部對照組 (EC) 集群。我們可以使用基於集群級別特徵的評分函數來計算共形 p 值,並選擇 p 值超過預定閾值的集群。 階層化試驗: 分層分析: 我們可以在每個層級內分別執行 FRT 和共形選擇性借用。這確保了每個層級內的治療效果估計值都是有效的,並且可以合併以獲得總體治療效果估計值。 共形評分函數: 在構建共形評分函數時,我們可以包含層級變數,以考慮不同層級之間的潛在差異。 需要注意的是,對於更複雜的試驗設計,共形選擇性借用的理論性質可能需要進一步研究。

如果 RCT 和 EC 之間的結果模型存在非線性關係,該怎麼辦?

如果 RCT 和 EC 之間的結果模型存在非線性關係,我們需要調整模型以適應這種非線性關係。 非線性結果模型: 我們可以使用非線性模型(例如廣義線性模型或機器學習模型)來擬合結果模型 µa(x)。這將允許我們更準確地估計治療效果,即使在存在非線性關係的情況下也是如此。 非線性評分函數: 我們可以使用非線性模型來構建共形評分函數 s(x, y)。這將允許我們更準確地識別與 RCT 患者具有相似結果模型的 EC 患者。 選擇適當的非線性模型取決於數據的特定特徵。我們可以使用交叉驗證等技術來比較不同模型的性能,並選擇最適合數據的模型。

如何利用機器學習技術來進一步提高共形選擇性借用的性能?

機器學習技術可以通過以下幾種方式提高共形選擇性借用的性能: 更靈活的評分函數: 我們可以使用機器學習模型(例如支持向量機或隨機森林)來構建更靈活的評分函數。這些模型可以捕獲變數之間的複雜非線性和交互作用,從而提高識別無偏差 EC 的能力。 特徵工程: 我們可以使用機器學習技術來執行特徵工程,例如特徵選擇和特徵提取。這可以幫助我們識別與結果最相關的特徵,並提高評分函數的預測能力。 集成學習: 我們可以使用集成學習技術(例如 boosting 或 bagging)來組合多個共形選擇性借用模型。這可以提高模型的穩定性和準確性。 需要注意的是,在使用機器學習技術時,重要的是要避免過度擬合。我們可以使用交叉驗證等技術來評估模型的泛化能力,並確保模型在未見數據上的性能良好。
0
star