下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
無監督技能學習
在沒有模擬器的情況下測量賦能:潛在預測賦能
本文提出了一種名為潛在預測賦能 (LPE) 的新演算法,可以在沒有環境模擬器的情況下,透過最大化技能與潛在狀態表示之間的互信息來學習多樣化的技能集。
1