Pobierz Linnk AI
•
Asystent Badawczy
>
Zaloguj się
spostrzeżenie
-
数学/最適制御
深層強化学習:凸最適化アプローチ
非線形システムの強化学習において、凸最適化を使用して最適Q関数の近似を行うアルゴリズムが収束することが示されました。
1