下载 Linnk AI
•
研究助手
>
登录
洞察
-
π-KRVIアルゴリズム
カーネル化された強化学習における最適な後悔境界
カーネル化された強化学習において、π-KRVIアルゴリズムは一般的なカーネルに対してサブリニアの後悔保証を提供する。
1