Baixe o Linnk AI
•
Assistente de Pesquisa
>
Entrar
insight
-
オフポリシーエピソード強化学習
Transformer ベースのオフポリシー エピソード強化学習: TOP-ERL
従来のエピソード強化学習(ERL)のサンプル効率の低さを、Transformer ベースの批評家を用いたオフポリシー更新スキームによって大幅に改善する新しいアルゴリズム、TOP-ERL を提案する。
1