核心概念
本文探討了兩種用於求解由隨機偏微分方程 (SPDE) 控制的隨機線性二次 (SLQ) 最優控制問題的數值方法:開迴路和閉迴路方法,並分析了它們在完全離散設置中的收斂速度。
本文研究了求解由隨機偏微分方程 (SPDE) 控制的隨機線性二次 (SLQ) 最優控制問題的數值方法。開發了兩種不同的方法,即開迴路和閉迴路方法,以確保在完全離散設置中的收斂速度。開迴路方法利用有限元方法進行空間離散化,並利用歐拉方法進行時間離散化,解決了耦合正向-反向 SPDE 的複雜性,並採用了適用於高維空間的梯度下降框架。另外,閉迴路方法應用反饋策略,側重於時空離散化的 Riccati 方程。這兩種方法都經過嚴格設計,可以應對完全離散 SLQ 問題的挑戰,提供嚴格的收斂速度和計算框架。
主要內容
本文分為兩個主要部分,分別介紹了基於開迴路和閉迴路方法的數值方法及其誤差分析:
開迴路方法
利用有限元方法對最優性系統(一個耦合的 FBSPDE)進行時空離散化,並推導出最優收斂速度。
採用梯度下降法對迭代計算進行解耦,並根據噪聲類型選擇精確計算條件期望 (β = 0) 或迴歸分析 (β ≠ 0)。
使用的數學工具包括 Malliavin 微積分、(隨機)Riccati 方程分析、(離散)半群理論和迴歸分析。
閉迴路方法
利用反饋算子表示最優控制,避免了求解 BSPDE,從而顯著降低了計算複雜度。
採用時空離散化方案求解隨機 Riccati 方程,並利用其解來求解確定性線性偏微分方程。
使用的數學工具包括最優控制分析、(隨機)Riccati 方程和(離散)半群理論。
總結
本文針對具有 SPDE 的 SLQ 問題,提出了兩種不同的數值方法,並對其進行了嚴格的分析。開迴路方法適用於更一般的隨機控制問題,而閉迴路方法則針對 SLQ 問題提供了更有效的計算方案。