下载 Linnk AI
•
研究助手
>
登录
洞察
-
数学/最適制御
深層強化学習:凸最適化アプローチ
非線形システムの強化学習において、凸最適化を使用して最適Q関数の近似を行うアルゴリズムが収束することが示されました。
1