Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
π-KRVIアルゴリズム
カーネル化された強化学習における最適な後悔境界
カーネル化された強化学習において、π-KRVIアルゴリズムは一般的なカーネルに対してサブリニアの後悔保証を提供する。
1