toplogo
登入

基於自適應降溫的貝葉斯反問題和罕見事件模擬方法


核心概念
本文提出了一種自適應降溫序列蒙特卡洛抽樣演算法,用於解決貝葉斯反問題和罕見事件模擬,該演算法利用過去對真實似然函數的評估構建代理模型,並在模擬過程中自適應地調整代理模型和目標後驗分佈的降溫方案。
摘要
edit_icon

客製化摘要

edit_icon

使用 AI 重寫

edit_icon

產生引用格式

translate_icon

翻譯原文

visual_icon

產生心智圖

visit_icon

前往原文

本文提出了一種自適應序列蒙特卡洛(SMC)抽樣演算法,用於解決貝葉斯反問題。該演算法適用於似然函數評估成本高昂,但可以通過代理模型近似的情況。代理模型通過先前對真實似然函數的評估構建,並需要對其誤差進行粗略估計。 該方法基於自適應 SMC 模擬,該模擬聯合調整似然近似和目標後驗分佈的標準降溫方案。此演算法非常適合後驗分佈集中在先驗分佈的罕見且未知區域的情況。它也適用於解決低溫和罕見事件模擬問題。 主要貢獻是提出了一種熵準則,將當前代理模型的精度與似然近似的最大逆溫度相關聯。後者用於對所謂的快照進行採樣,執行精確的似然評估,並更新代理模型及其誤差量化。 在理想化的演算法框架中,本文提出了一些一致性結果。數值實驗特別使用了降階基方法來構建橢圓偏微分方程的部分觀測解的近似參數解。實驗結果證明了演算法的收斂性,並顯示出在可比精度下顯著降低了計算成本(接近 10 倍)。
1.1. 背景與問題 本文考慮設計一種演算法蒙特卡洛程序的經典問題,該程序根據目標概率分佈 η∗ β∞(對於一個特定的 β∞∈R)進行採樣,該分佈被明確定義為一個族中的元素: η∗ β def 1 Z∗ β eβS∗dπ, β ∈R。 其中,Z∗ β def = π(eβS∗) 表示相關的未知歸一化常數,通常也必須通過蒙特卡洛程序計算,π 表示狀態空間 X 上的一個給定且易於模擬的參考概率分佈,S∗: X →R 表示一個給定但計算成本高昂的實值分函數。 以下兩個背景將作為主要動機。在這兩種情況下,分函數的形式為: S∗(x) = score(Ψ∗(x)), 其中 score 是一個易於計算的物理興趣函數,它依賴於一些額外的參數(如觀測數據),Ψ∗(x) 是由變量 x ∈X 參數化的複雜物理系統的數值計算結果。 在反問題的貝葉斯公式中,β∞= 1,η∗ β∞是部分觀測物理系統 Ψ∗(x) 的一些不確定性參數 x ∈X 的後驗分佈。π 模擬了不確定性參數的先驗分佈,權重 ∝eS∗是給定一些部分觀測值的情況下這些參數的似然函數。像往常一樣,我們希望進行蒙特卡洛抽樣,然後根據這個後驗分佈來近似期望值。 在罕見事件問題中,我們希望估計小概率 p∗def = π ({S∗≥1}),它對應於一個大的預定水平 ℓ∈R,其分函數定義為 S∗(x) = 1−max(ℓ−Ψ∗(x), 0)/ℓ。由於 limβ∞→∞π(eβ∞S∗) = p∗,因此罕見事件概率的估計就變成了歸一化常數 Z∗ β∞在 β∞→∞ 時的估計,即溫度 1/β∞趨於零時的估計。 在這項工作中,我們將關注從業者必須面對兩種類型困難的情況。第一種困難是經典的,當 β 增加時(或者在貝葉斯環境中當測量噪聲變小時),會產生一個低溫問題,類似於全局優化。它使從業者面臨著一個計算挑戰:定義 η∗ β 的密度將大部分概率質量集中在 X 的特定但可能未知的區域,這些區域大致由 S∗的最大值描述。直接使用 π 的蒙特卡洛模擬進行抽樣通常非常耗時,甚至不可行,因為它可能需要非常大的樣本量。例如,為了獲得合理的估計方差,在罕見事件模擬環境中,樣本量應為 1/p∗的數量級,這顯然是令人望而卻步的。 一種非常流行的通用策略是採用序列蒙特卡洛(SMC)策略來模擬根據 η∗ β 分佈的樣本,該策略首先從根據 π 分佈的粒子蒙特卡洛樣本開始,然後通過結合使用重要性抽樣(IS)、加權樣本的重採樣(選擇)和基於合適的馬爾可夫鏈蒙特卡洛轉移的粒子變異,依次對 β 值遞增的 η∗ β 進行抽樣。更具體地說,我們將對自適應變量降溫方法感興趣。 第二個困難出現在 Ψ∗的數值評估極其昂貴的情況下;如此昂貴以至於在例如通常的 SMC 方法中所需的評估次數變得令人望而卻步。為了規避這個問題,我們假設物理模型 Ψ∗可以通過一個簡化模型 Ψ 來近似;與使用 Ψ∗進行一次真實分數評估相比,評估 Ψ 的成本很小。 我們考慮的簡化模型 Ψ 假設具有兩個關鍵特性。為了解釋這些特性,讓我們從現在開始將近似分函數表示為: S(x) = score (Ψ(x)) ∈R。 第一個特性是與 S 相關的後驗逐點誤差量化。這種誤差量化的形式是一個函數 E(x),它滿足以下形式的近似逐點估計: |S(x) −S∗(x)| ≈E(x), ∀x ∈X。 我們強調,逐點估計 (1.2) 不必是對誤差的非常精確的估計,而只需要是一個粗略的估計,揭示誤差的趨勢。 第二個關鍵特性假設我們能夠通過以下形式的程序更新簡化模型: {(X1, Ψ∗(X1)), . . . , (Xk, Ψ∗(Xk)} reduced model 7−−−−−−−−−→Ψ = Ψ(X1,...,Xk), 它將狀態空間 X 中的任何狀態序列(這裡稱為快照樣本)以及為每個快照評估的關聯真實模型 Ψ∗的解作為輸入。輸出是簡化模型 Ψ。簡化模型可以通過各種可能非常不同的方法構建。在這項工作中,我們將考慮任何簡化建模程序和任何形式為 (1.2) 的近似誤差量化。 當 Ψ∗(x) 是由不確定性變量 x 參數化的偏微分方程 (PDE) 的解時,一種特別適合於這種情況的模型簡化程序是降階基。 (1.2) 中的相關誤差估計同時更新,並且出於第 2.2 節中將要解釋的原因,我們還要求誤差 E(k) 在迭代 k 時已經評估過的快照點 X(k) 上消失: E(X1,...,Xk)(X(j)) = 0, ∀j ≤k。 為了提高可讀性,在整篇論文中,我們可能會使用上標 (k) 代替 (X1, . . . , Xk),或者對於任何依賴於快照樣本 (X1, . . . , Xk) 的量,甚至可以省略它。例如,由 k 個快照構建的簡化分數可以表示為: S(x) def = S(k)(x) def = S(X1,...,Xk)(x)。

從以下內容提煉的關鍵洞見

by Frederic Cer... arxiv.org 10-25-2024

https://arxiv.org/pdf/2410.18833.pdf
Adaptive reduced tempering For Bayesian inverse problems and rare event simulation

深入探究

本文提出的自適應降溫演算法如何與其他貝葉斯優化方法(例如高斯過程迴歸)相結合,以進一步提高計算效率?

高斯過程迴歸(Gaussian Process Regression, GPR)作為一種常用的貝葉斯優化方法,可以有效地用於代理模型的建構。將自適應降溫演算法與 GPR 結合,可以充分利用兩者的優勢,進一步提高計算效率。具體來說,可以通過以下步驟實現: 利用 GPR 建立代理模型: 使用已有的真實模型評估結果作為訓練數據,訓練一個 GPR 模型來近似真實模型。GPR 模型可以提供代理模型的預測值以及預測的不確定性,可以用於誤差估計 E(x) 的建構。 基於誤差估計指導快照選取: 自適應降溫演算法的核心步驟之一是選取新的快照點以更新代理模型。利用 GPR 模型提供的預測不確定性,可以優先選擇那些預測不確定性較高的區域進行真實模型評估,從而提高代理模型的精度和效率。 動態更新 GPR 模型: 在獲得新的快照點後,可以將其加入 GPR 模型的訓練數據中,動態更新 GPR 模型。這樣可以確保代理模型隨著迭代次數的增加而不断改进,更好地逼近真實模型。 通過以上步驟,將自適應降溫演算法與 GPR 結合,可以有效地利用 GPR 模型提供的預測不確定性來指導快照選取,從而提高代理模型的精度和效率,進一步降低計算成本。

在代理模型誤差估計不可靠或難以獲得的情況下,如何修改該演算法以保持其有效性?

在代理模型誤差估計不可靠或難以獲得的情況下,可以考慮以下修改方案來保持自適應降溫演算法的有效性: 基於替代指標的快照選取策略: 當無法獲得可靠的誤差估計時,可以考慮使用其他指標來指導快照選取。例如,可以使用以下策略: 最大化代理模型預測值的方差: 優先選擇那些代理模型預測值方差較大的區域進行真實模型評估,這些區域通常對應著代理模型的不確定性較高的區域。 基於梯度信息的選取策略: 如果可以計算代理模型的梯度信息,可以優先選擇那些梯度變化較大的區域進行真實模型評估,這些區域通常對應著代理模型預測值變化較快的區域。 多代理模型的集成學習: 可以考慮使用多個不同的代理模型,並使用集成學習的方法來組合它們的預測結果。這樣可以降低單個代理模型誤差帶來的影響,提高整體預測的準確性和魯棒性。 基於信賴域的代理模型更新策略: 可以引入信賴域的概念,僅在信賴域內使用代理模型進行計算,而在信賴域外則使用真實模型進行評估。隨著迭代次數的增加,可以逐步擴大信賴域的範圍,從而逐步提高代理模型的使用比例,降低計算成本。 需要注意的是,在誤差估計不可靠的情況下,演算法的收斂速度和精度可能會受到一定影響。因此,需要根據具體問題的特点和需求,選擇合适的修改方案,並對演算法的性能進行仔細的評估和驗證。

該演算法的收斂速度如何受到代理模型複雜性和精度以及目標分佈特性的影響?

自適應降溫演算法的收斂速度受到多個因素的影響,其中代理模型的複雜性和精度以及目標分佈的特徵起著至關重要的作用。 1. 代理模型的複雜性和精度: 代理模型的複雜性: 更複雜的代理模型通常具有更强的表達能力,可以更好地逼近真實模型,但同時也需要更多的訓練數據和計算時間。如果代理模型過於簡單,則可能無法準確地捕捉真實模型的特徵,導致收斂速度變慢。 代理模型的精度: 代理模型的精度越高,對真實模型的逼近程度越高,演算法的收斂速度就越快。反之,如果代理模型的精度較低,則需要更多的迭代次數才能達到相同的精度要求,從而降低收斂速度。 2. 目標分佈的特徵: 目標分佈的維度: 目標分佈的維度越高,搜索空間就越大,演算法的收斂速度通常會變慢。 目標分佈的平滑性: 如果目標分佈比較平滑,則更容易找到最優解,演算法的收斂速度也會比較快。反之,如果目標分佈存在很多局部最優解或是不連續的區域,則演算法容易陷入局部最優解,導致收斂速度變慢。 目標分佈的稀疏性: 如果目標分佈非常稀疏,即只有很小一部分區域具有較高的概率密度,則演算法需要花費更多的時間來探索這些區域,導致收斂速度變慢。 總之,自適應降溫演算法的收斂速度是一個複雜的問題,受到多個因素的影響。 在實際應用中,需要根據具體問題的特点和需求,選擇合适的代理模型和演算法參數,並對演算法的性能進行仔細的評估和驗證。
0
star