本論文は、連続時間強化学習の枠組みにおいて、状態と制御に依存する拡散係数を持つ線形二次制御問題を扱っている。
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yilie Huang,... lúc arxiv.org 09-24-2024
Yêu cầu sâu hơn
Mục lục
状態依存性と制御依存性を持つ拡散過程に対する連続時間強化学習の劣線形レグレット解析
Sublinear Regret for a Class of Continuous-Time Linear--Quadratic Reinforcement Learning Problems
提案手法を多次元状態や制御、あるいは実行報酬を含む一般の線形二次制御問題に拡張することは可能か?
提案手法の劣線形レグレット上界は最適なものか、それとも改善の余地があるか?
提案手法の考え方を、非線形システムや部分観測問題などの一般の強化学習問題に適用できるか?
Công cụ & Nguồn lực
Nhận Bản tóm tắt Chính xác và Thông tin Chi tiết Chính với Trình tóm tắt PDF AI