本論文は、強化学習の観点から連続時間および状態空間の最適停止問題を探索的に定式化し、その解法を提案する。特に、確率的な停止時間を導入し、パフォーマンス基準に累積残差エントロピーを加えることで、探索と最適化のバランスを取る。この問題は、有限燃料の (n + 1) 次元退化特異確率制御問題の形をとり、動的計画法を用いて解析的に解くことができる。さらに、実オプション問題の具体例を通して、提案手法の有効性を示す。
本論文では、決定論的システムに対する無限時間最適制御問題を扱う。単一の予測最小化問題を用いるMPCではなく、複数の予測最小化問題を並列に解くことで、より良い性能保証を持つ近似解を得る並列MPC手法を提案する。
正錐上の最適制御問題に対して、ベルマン方程式が線形関数で解けることを示した。この解は凸最適化問題を解くことで得られる。
本論文は、状態と制御変数に乗算ノイズが存在する特定のクラスの制御対象に対する新しい分布頑健型モデル予測制御(DRMPC)アルゴリズムを提案する。最適制御問題をSI-SDPとして定式化し、SI-SDPを効率的に解くアプローチを開発する。
ADMM アルゴリズムを用いて線形モデル予測制御問題を効率的に解くことができ、状態と入力の制約下で閉ループシステムを漸近的に安定化できる。
リーディングエキスパートの意思決定変更率を模倣することで、小売投資家の最適投資決定が変化する。
本論文は、二段階 DC 最適電力流れ問題を効率的かつ最適に解くための学習ベースのアプローチを提案する。提案手法は、フィージビリティを保証する特殊な学習アーキテクチャを使用し、従来の反復型ソルバーや線形近似手法に比べて大幅な計算時間の短縮を実現する。
非線形システムの出力フィードバック制御において、最悪ケースの性能を最小化する制御則を効率的に設計する手法を提案する。
低推力軌道遷移の最適化問題を効率的に解くための新しい手法を提案する。新しい軌道要素を用いた動的モデルと、ライアプノフ理論に基づく初期値生成スキームを活用することで、燃料消費と飛行時間のトレードオフを容易に扱えるようにした。
本研究では、線形ダイナミックシステムの状態変数の確率分布を所望の分布に制御する問題を扱う。Gromov-Wasserstein 距離を終端コストとして導入することで、状態分布の構造的特性を捉えた制御問題を定式化する。この問題は差分凸計画問題として定式化でき、効率的に解くことができる。