核心概念
本文提出了一種基於中位數後驗推論的可擴展高斯過程回歸方法,用於估計多污染物混合對健康的影響,特別是在大型數據集上的應用。
統計資料
研究使用了 2001 年 1 月 1 日至 2012 年 12 月 31 日期間在馬薩諸塞州出生的 907,766 名新生兒的數據。
排除缺失數據後,分析使用了 685,857 個觀察值。
該研究使用了 K = 686 個數據分割,每個分割包含約 1000 個樣本。
對於每個分割,MCMC 採樣器在 1,000 次預燒錄迭代後運行 1,000 次迭代,每五個樣本保留一個用於進一步推斷,因此每個分割保留 N = 200 個後驗樣本。