核心概念
相較於僅使用完整數據的分析方法,採用隨機效應方法處理線性混合模型中缺失的協變量,能更有效地估計模型參數。
摘要
文獻資訊
Nguyen, T., Zhang, J., & Jiang, J. (2024). A Random-Effects Approach to Linear Mixed Model Analysis of Incomplete Longitudinal Data. arXiv preprint arXiv:2411.14548.
研究目標
本研究旨在探討如何有效處理線性混合模型(LMM)中缺失的協變量和響應變量,並提出了一種基於隨機效應的方法。
方法
- 針對僅有協變量缺失的情況,研究提出將缺失協變量視為隨機效應,並將其中心化,從而將具有缺失協變量的 LMM 轉換為沒有缺失協變量的 LMM。
- 針對同時存在協變量和響應變量缺失的情況,研究先採用上述隨機效應方法處理缺失的協變量,然後使用基於觀察到的響應變量得到的最佳預測值來替換缺失的響應變量。
- 研究通過模擬研究比較了所提出的方法(CCE、CCPE)與僅使用完整數據分析 (CDOE) 和多重插補法 (MICE) 的性能。
主要發現
- 模擬研究結果顯示,在僅有協變量缺失的情況下,CCE 在估計模型參數方面始终優於 CDOE。
- 在同時存在協變量和響應變量缺失的情況下,CCE 和 CCPE 的表現均優於 CDOE,但 CCPE 相較於 CCE 並沒有顯著的提升。
- MICE 的性能在不同參數和樣本量下表現不穩定。
主要結論
- 採用隨機效應方法處理線性混合模型中缺失的協變量,能夠提高模型參數估計的效率。
- 使用預測方法處理缺失的響應變量,相較於僅使用完整數據分析有所提升,但與僅處理協變量缺失的方法相比,沒有顯著優勢。
研究意義
本研究為處理線性混合模型中缺失數據問題提供了一種新的思路,並通過模擬研究驗證了方法的有效性,為相關領域的研究提供了參考。
局限與未來研究方向
- 未來的研究可以探討在更復雜的缺失機制下,隨機效應方法的性能表現。
- 可以進一步研究如何改進預測方法,以提高 CCPE 的效率。
統計資料
研究模擬了不同樣本量(m = 40, 100, 400)和缺失比例的數據。
在僅有協變量缺失的模擬中,設定了一個時間變量(t = 1, ..., 5)和四個協變量,其中兩個協變量存在缺失值。
在同時存在協變量和響應變量缺失的模擬中,設定了與前述相同的協變量和時間變量,並設定了響應變量的缺失機制。