מושגי ליבה
本文提出了一種基於自回歸專家混合模型的模仿學習方法,該方法可以僅從狀態軌跡中學習控制策略,並通過引入李雅普諾夫穩定性約束來確保模型的穩定性,適用於多步預測任務。
סטטיסטיקה
在车道保持场景中,使用了 5 条轨迹数据,其中 3 条用于训练,1 条用于验证,1 条用于测试。
在双车道变换场景中,使用了 21 条轨迹数据,其中 14 条用于训练,3 条用于验证,4 条用于测试。
轨迹数据的采样率为 1 kHz,下采样至 20 Hz。
模型的正则化参数 γ1 = γ2 = γ3 = 5 × 10−6。
在车道保持场景中,模型的模态数量为 3。
在双车道变换场景中,模型的模态数量为 4。