本論文では、確率空間における離散時間有限時間最適制御問題を扱う。この問題は、システムの状態が確率測度であるという特徴を持つ。
まず、グラウンド空間におけるダイナミックプログラミングを解く。これにより、各粒子の最適な入力が得られる。
次に、得られた最適入力と、確率測度間の最適輸送問題を解くことで、全体としての最適な状態-入力分布が構築される。
つまり、個々の粒子の最適制御と全体としての最適な割り当てが分離されており、これが最適解を導く鍵となる。
この分離原理により、確率空間におけるダイナミックプログラミングの複雑さを回避でき、計算コストを大幅に削減できる。
また、本手法は従来研究の多くを包含するものであり、より一般的な設定でも適用可能である。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문