本論文は、連続時間強化学習の枠組みにおいて、状態と制御に依存する拡散係数を持つ線形二次制御問題を扱っている。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Yilie Huang,... alle arxiv.org 09-24-2024
Domande più approfondite
Sommario
状態依存性と制御依存性を持つ拡散過程に対する連続時間強化学習の劣線形レグレット解析
Sublinear Regret for a Class of Continuous-Time Linear--Quadratic Reinforcement Learning Problems
提案手法を多次元状態や制御、あるいは実行報酬を含む一般の線形二次制御問題に拡張することは可能か?
提案手法の劣線形レグレット上界は最適なものか、それとも改善の余地があるか?
提案手法の考え方を、非線形システムや部分観測問題などの一般の強化学習問題に適用できるか?
Strumenti & Risorse
Ottieni un riepilogo accurato e informazioni chiave con AI PDF Summarizer