Linnk AI letöltése
•
Kutatási asszisztens
>
Bejelentkezés
betekintés
-
基於上下文的離線元強化學習中的任務表示轉移
檢視我們所忽視的內容:控制基於上下文的離線元強化學習中的任務表示轉移
前人的優化框架忽視了任務表示在交替優化過程中的變化所帶來的影響,這可能導致性能提升崩潰。通過適當地控制任務表示的轉移,可以保證單調的性能提升。
1