核心概念
本文介紹了如何利用可測選擇定理推導連續時間隨機控制/停止問題的動態規劃原理。通過在適當的標準化空間上考慮問題的鞅問題表述,可以檢查所需的可測性條件。這涵蓋了最經典的受控/停止擴散過程問題。此外,我們研究了通過分段常數控制問題來近似最優控制問題的性質。作為副產品,我們得到了受控/停止擴散過程問題的強、弱和放鬆形式之間的等價性結果。
摘要
本文主要包含以下內容:
-
介紹了連續時間隨機控制問題的不同形式,包括強形式、弱形式和放鬆形式。這些形式在不同的應用背景下被廣泛研究和使用。
-
概述了如何利用可測選擇定理推導連續時間隨機控制/停止問題的動態規劃原理。關鍵是在適當的標準化空間上考慮問題的鞅問題表述,以檢查所需的可測性條件。
-
在此框架下,我們輕易地得到了不同形式的受控/停止擴散過程問題的動態規劃原理。
-
研究了最優控制問題通過分段常數控制問題進行近似的性質。作為副產品,我們得到了不同形式之間的等價性結果。
總的來說,本文提供了一個統一的方法來研究連續時間隨機控制問題的動態規劃原理及其應用,涵蓋了強、弱和放鬆形式,並得到了一些重要的等價性結果。
統計資料
以下是一些重要的數據和指標:
"一般最優控制/停止問題可以描述為:'某個隨機過程的時間演化受到控制者採取的"行動"的影響。控制者在每個時間點採取的行動取決於可獲得的信息。控制目標是選擇行動以及時間範圍,以最大化某些函數的期望值。'"
"在隨機控制理論中,受控擴散過程問題似乎是最流行和最研究的主題,特別是由於其在金融等領域的應用。"
"我們得到了不同形式的受控/停止擴散過程問題的動態規劃原理,並研究了通過分段常數控制問題進行近似的性質。作為副產品,我們得到了不同形式之間的等價性結果。"
引述
"一般最優控制/停止問題可以描述為:'某個隨機過程的時間演化受到控制者採取的"行動"的影響。控制者在每個時間點採取的行動取決於可獲得的信息。控制目標是選擇行動以及時間範圍,以最大化某些函數的期望值。'"
"在隨機控制理論中,受控擴散過程問題似乎是最流行和最研究的主題,特別是由於其在金融等領域的應用。"