ดาวน์โหลด Linnk AI
•
ผู้ช่วยวิจัย
>
ลงชื่อเข้าใช้
ข้อมูลเชิงลึก
-
オフポリシーエピソード強化学習
Transformer ベースのオフポリシー エピソード強化学習: TOP-ERL
従来のエピソード強化学習(ERL)のサンプル効率の低さを、Transformer ベースの批評家を用いたオフポリシー更新スキームによって大幅に改善する新しいアルゴリズム、TOP-ERL を提案する。
1