Linnk AIをダウンロード
•
AIリサーチアシスタント
>
サインイン
インサイト
-
数学/最適制御
深層強化学習:凸最適化アプローチ
非線形システムの強化学習において、凸最適化を使用して最適Q関数の近似を行うアルゴリズムが収束することが示されました。
1