Core Concepts
本研究では、ハミルトン関数の陽な表現を必要としない高次元ハミルトン・ヤコビ・ベルマン(HJB)方程式と確率最適制御問題を解くための新しい数値手法であるSOC-MartNetを提案する。SOC-MartNetは、制御ネットワークと価値ネットワークを訓練し、関連するハミルトン過程を最小化し、コスト過程がマルチンゲールになるように設計されている。
Abstract
本論文では、高次元HJB型方程式とその応用である確率最適制御問題(SOCP)の数値解法について検討している。
まず、HJB型方程式を確率的ニューラルネットワーク学習過程に書き換え、制御ネットワークと価値ネットワークを訓練することで、関連するハミルトン過程を最小化し、コスト過程がマルチンゲールになるように設計した手法であるSOC-MartNetを提案した。
SOC-MartNetでは、ハミルトン関数の陽な表現を必要とせず、コスト過程がマルチンゲールになるように制御ネットワークと価値ネットワークを敵対的に訓練する。これにより、ハミルトン関数の最小化を各時空間点で行う必要がなくなり、高効率な計算が可能となる。
数値実験の結果、SOC-MartNetは次元が500次元までの HJB型方程式とSOCPを効率的に解くことができることが示された。
Stats
提案手法SOC-MartNetは、次元が500次元までのHJB型方程式とSOCPを効率的に解くことができる。