本論文提出了一種新的方法,用於在有界區間上逼近具有馬特恩協方差函數的高斯過程,從而能夠以線性計算成本進行統計推斷。與現有方法不同的是,新方法保證了協方差近似的指數快速收斂,確保了計算效率和高精度。此外,該方法產生了近似過程的馬可夫表示,從而簡化了其與通用統計推斷軟件的集成。
高斯隨機過程,特別是具有馬特恩協方差函數的過程,在統計學和機器學習中發揮著至關重要的作用,應用於空間統計、計算機實驗和貝葉斯優化等領域。然而,由於需要對密集的協方差矩陣進行因式分解,基於協方差函數定義高斯過程會導致推斷和預測的計算成本很高。為了應對這個“大n”問題(指的是具有 n 個觀測值的數據集所需的 O(n³) 計算成本),近年來人們開發了幾種方法來降低成本。
本論文提出的方法基於對高斯過程譜密度的有理逼近。通過使用最佳有理逼近,可以將逼近過程表示為 m 個獨立高斯馬可夫過程的總和,從而產生稀疏的精度(逆協方差)矩陣,這些矩陣實際上是帶狀矩陣。這種表示法具有多個優點,其中最重要的是它可以直接整合到貝葉斯推斷的通用軟件中,例如 R-INLA。
通過模擬研究,將新方法與其他現有方法(包括最近鄰高斯過程逼近、隨機傅立葉特徵方法、主成分分析方法、錐化方法和基於協方差的有理 SPDE 方法)進行了比較。結果表明,在高斯過程回歸等統計任務中,對於固定的計算成本,新方法在準確性方面優於所有其他方法。
本論文提出了一種通用的方法,用於處理具有馬特恩協方差函數的高斯過程,該方法在有界區間上具有線性計算成本,並且協方差近似具有指數收斂性。該方法已在 rSPDE 軟件包中實現,該軟件包與 R-INLA 和 inlabru 等流行工具兼容,便於無縫集成到貝葉斯分層模型中。未來的研究方向包括將該方法擴展到更一般的域。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询