Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
オフポリシーエピソード強化学習
Transformer ベースのオフポリシー エピソード強化学習: TOP-ERL
従来のエピソード強化学習(ERL)のサンプル効率の低さを、Transformer ベースの批評家を用いたオフポリシー更新スキームによって大幅に改善する新しいアルゴリズム、TOP-ERL を提案する。
1