核心概念
DiffusionPDE 是一種新的框架,可以利用生成式擴散模型從稀疏數據中求解偏微分方程式,在正向和反向問題上都優於現有方法。
摘要
本文介紹了一個使用生成式擴散模型求解偏微分方程式 (PDE) 的通用框架 DiffusionPDE,尤其關注於缺乏完整場景資訊以應用經典求解器的情況。大多數現有的正向或反向 PDE 方法在數據觀測或基礎係數不完整時表現不佳,而這在現實世界的測量中很常見。DiffusionPDE 可以通過模擬解空間和係數空間的聯合分佈來同時填補缺失資訊並求解 PDE。實驗結果顯示,學習到的生成先驗可以準確地求解各種在部分觀測下的 PDE,顯著優於現有最先進的正向和反向方法。
引言
偏微分方程式 (PDE) 是現代科學的基石,支撐著許多解釋自然現象的當代物理理論。求解 PDE 的能力使我們能夠預測系統的未來狀態(正向過程)並從狀態測量中估計潛在的物理特性(反向過程)。
然而,經典方法可能非常耗時,這促使了數據驅動、基於學習的求解器的發展,這些求解器速度顯著提高並且能夠處理一系列 PDE。這些基於學習的方法通常使用深度神經網絡學習輸入係數及其解之間的確定性映射。
儘管取得了進展,但現有的基於學習的方法與經典求解器一樣,依賴於對係數的完整觀測來映射解。然而,關於潛在物理特性或系統狀態的完整資訊很少能獲得;實際上,大多數測量在空間和時間上都是稀疏的。經典求解器和最先進的數據驅動模型通常忽略這些情況,因此在面對部分觀測時會失敗。這種限制將它們的使用主要限制在合成模擬中,在這些模擬中,完整的場景配置是設計好的,這使得它們難以應用於現實世界的情況。
方法
概述
為了在不確定性下解決物理信息正向和反向問題,我們首先在一系列偏微分方程式 (PDE) 上預訓練一個擴散生成模型。該模型旨在學習 PDE 係數(或初始狀態)及其對應解(或最終狀態)的聯合分佈。我們的方法涉及使用來自任一側或兩側的稀疏觀測來恢復兩個空間中的完整數據。我們通過迭代去噪隨機高斯噪聲來實現這一點,就像在常規擴散模型中一樣,但在去噪過程中,稀疏觀測和 PDE 函數提供了額外的指導。
求解帶有引導擴散的 PDE
我們的工作重點是兩類 PDE:靜態 PDE 和動態時間相關 PDE。靜態系統(例如,達西流或泊松方程)由與時間無關的函數 f 定義:
f(c; a, u) = 0 in Ω⊂Rd,
u(c) = g(c) in ∂Ω,
其中 Ω 是有界域,c ∈Ω 是空間坐標,a ∈A 是 PDE 係數場,u ∈U 是解場。∂Ω 是域 Ω 的邊界,u|∂Ω= g 是邊界約束。我們的目標是從 a 或 u 或兩者上的稀疏觀測中恢復 a 和 u。
類似地,我們考慮動態系統(例如,Navier-Stokes):
f(c, τ; a, u) = 0, in Ω× (0, ∞)
u(c, τ) = g(c, τ), in ∂Ω× (0, ∞)
u(c, τ) = a(c, τ), in ¯Ω× {0}
其中 τ 是時間坐標,a = u0 ∈A 是初始條件,u 是解場,u|Ω×(0,∞) = g 是邊界約束。我們的目標是同時從 a、uT 或兩者上的稀疏觀測中恢復 a 和特定時間 T 的解 uT := u(·, T)。
最後,我們探索了由 Burgers 方程控制的一維動態系統中跨所有時間步長 u0:T 的狀態恢復。我們的網絡 Dθ 模擬所有一維狀態的分佈,包括在時間維度上堆疊的初始條件 u0 和解 u1:T,形成一個二維數據集。
引導擴散算法
在數據驅動的 PDE 文獻中,上述任務可以通過學習 a 和 u(或動態系統的 uT)之間的定向映射來實現。因此,現有方法通常為正向解算子 F : A →U 和反向解算子 I : U →A 訓練單獨的神經網絡。
我們的方法使用單個網絡和使用引導擴散框架的算法來統一正向和反向算子。DiffusionPDE 可以使用一個預先訓練的擴散模型 Dθ 來處理任意稀疏模式,該模型學習 A 和 U 的聯合分佈,在通道維度上連接,表示為 X。因此,我們的數據 x ∈X,其中 X := A × U。我們遵循典型的擴散模型程序 [45] 在一系列 PDE 上訓練我們的模型。
一旦我們訓練了擴散模型 Dθ,我們就會在推理過程中採用我們的物理信息 DPS [46] 公式來指導 x ∈X 的採樣,以滿足稀疏觀測和給定的 PDE,如算法 1 中所述。我們遵循公式 5 使用兩個指導術語修改評分函數:
∇xi log p(xi|yobs, f) ≈∇xi log p(xi) −ζobs∇xiLobs −ζpde∇xiLpde,
其中 xi 是去噪步驟 i 處的噪聲數據,yobs 是觀測值,f(·) = 0 是基礎 PDE 條件。Lobs 和 Lpde 分別表示稀疏觀測的 MSE 損失和 PDE 方程殘差:
Lobs(xi, yobs; Dθ) = 1/n∥yobs −ˆxiN∥22 = 1/n Σ(yobs(oj) −ˆxiN(oj))2,
Lpde(xi; Dθ, f) = 1/m∥0 −f(ˆxiN)∥22 = 1/m ΣΣf(cj, τk; ˆuj, ˆaj)2,
其中 ˆxiN = Dθ(xi) 是去噪時間步長 i 處的乾淨圖像估計,可以將其拆分為係數 ˆui 和解 ˆai。這裡,m 是網格點(即像素)的總數,n 是稀疏觀測點的數量。oj 表示第 j 個觀測的時空坐標。請注意,在不失一般性的情況下,可以針對系統中所有適用的 PDE 函數 f 累積 Lpde,並且對於靜態系統,時間分量 τk 被忽略。
實驗
我們展示了 DiffusionPDE 在各種 PDE 中用於反向和正向問題的有用性,並將其與最近基於學習的技術進行了比較。我們在以下 PDE 系列上進行了測試。
達西流
非齊次亥姆霍茲方程
無界納維-斯托克斯方程
有界納維-斯托克斯方程
Burgers 方程
實驗結果表明,DiffusionPDE 在稀疏觀測下,在正向和反向問題上都優於其他方法,包括 PINO [4]、DeepONet [5]、PINNs [6] 和 FNO [3],證明了我們方法的新穎性和獨特性。
結論和未來的工作
在這項工作中,我們開發了 DiffusionPDE,這是一種基於擴散的 PDE 求解器,它通過使用生成先驗來填補缺失信息,從而解決了從部分觀測中求解 PDE 的挑戰。我們制定了一個擴散模型,該模型學習係數(或初始狀態)空間和解(或最終狀態)空間的聯合分佈。在採樣過程中,DiffusionPDE 可以通過使用稀疏測量和 PDE 約束來指導其去噪,從而靈活地生成合理的數據。我們的新方法顯著改進了現有的最先進方法,向著利用生成模型的力量的通用 PDE 求解框架邁進。
這項工作出現了幾個有希望的未來研究方向。目前,DiffusionPDE 僅限於求解二維動態 PDE 的切片;將其功能擴展到涵蓋這些方程的完整時間間隔提供了一個重要的機會。此外,該模型在缺乏約束的空間中難以準確地解決問題是另一個需要探索的關鍵領域。DiffusionPDE 還存在採樣過程緩慢的問題,可能需要更快的解決方案。
統計資料
DiffusionPDE 能夠以 1% ∼10% 的誤差恢復 a 和 u,在大多數 PDE 系列中,任何一側的觀測點約為 6%。
一旦觀察到超過 3% 的點,DiffusionPDE 對觀察次數變得不敏感,並且可以很好地解決問題。
u 的相對誤差從 9.3% 降低到 0.6%,a 的相對誤差從 13.2% 降低到 9.4%。