Основные понятия
本文提出了一種新的數值方案來解決遺忘型後向隨機微分方程。該方案利用了一個新的概率表示來描述偏微分方程的解,並基於此提出了一個可實現的數值方案,包括皮卡迭代、空間網格離散和蒙特卡羅近似。在滿足一定技術條件的情況下,我們得到了數值誤差的上界估計。同時也提供了一些數值實驗來說明這種方法在低維情況下的有效性。
Аннотация
本文研究了遺忘型後向隨機微分方程(EBSDE)的數值逼近問題。EBSDE是一種有效的工具,用於分析具有遺忘型目標函數的最優控制問題。
首先,作者建立了一個新的概率表示來描述EBSDE的解,即值函數及其梯度。這是通過利用經典的概率表示來表示梯度,並引入了一種新的權重來克服積分在無限時間區間上的發散問題。
基於這個新的表示,作者提出了一個可實現的數值方案,包括皮卡迭代、空間網格離散和蒙特卡羅近似。在滿足一定技術條件的情況下,作者得到了數值誤差的上界估計。
最後,作者提供了一些數值實驗,展示了該方法在低維情況下的有效性。
Статистика
遺忘型後向隨機微分方程的解可以表示為 Yt = u(Xt),Zt = ¯u(Xt)Σ,其中 u 和 ¯u 滿足線性增長條件。
值函數 u 是偏微分方程 Lu(x) + f(x, ∇xu(x)Σ) = λ 的viscosity解。
梯度 v = ∇xu 滿足一個期望型的固定點方程,其中涉及 v、隨機過程 X 及其切向過程。
Цитаты
"遺忘型後向隨機微分方程(EBSDE)是一種有效的工具,用於分析具有遺忘型目標函數的最優控制問題。"
"我們建立了一個新的概率表示來描述EBSDE的解,即值函數及其梯度。"
"基於這個新的表示,我們提出了一個可實現的數值方案,包括皮卡迭代、空間網格離散和蒙特卡羅近似。"