核心概念
本文提出了一種名為 Wasserstein 品質多樣性模仿學習 (WQDIL) 的新方法,透過解決對抗性訓練的不穩定性和行為過擬合問題,從有限的演示中學習多樣化且高效能的策略。
標題: 從多樣化行為中進行模仿:基於單步存檔探索的 Wasserstein 品質多樣性模仿學習
作者: Xingrui Yu, Zhenglin Wan, David Mark Bossens, Yueming Lyu, Qing Guo, and Ivor W. Tsang
本研究旨在解決從有限的演示中學習多樣化且高效能策略的挑戰,特別是在對抗性品質多樣性模仿學習 (QDIL) 中遇到的訓練不穩定性和行為過擬合問題。