Grunnleggende konsepter
本稿では、外乱オブザーバーと残差モデル学習を組み合わせた、不確実性下での安全な強化学習のための新しいフレームワークを提案する。
Sammendrag
安全強化学習のための外乱オブザーバーベース制御バリア関数(残差モデル学習を用いて)
Kalaria, D., Lin, Q., & Dolan, J. M. (2024). Disturbance Observer-based Control Barrier Functions with Residual Model Learning for Safe Reinforcement Learning. arXiv preprint arXiv:2410.06570v1.
本研究は、内部および外部の擾乱が存在する状況下で、安全な制御ポリシーを最適化できる、ほぼモデルフリーな安全強化学習フレームワークを提案することを目的とする。