下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
協同駕駛策略蒸餾
基於語言驅動的策略蒸餾方法,用於多智能體強化學習中的協同駕駛
本文提出了一種名為 LDPD 的語言驅動策略蒸餾框架,利用大型語言模型 (LLM) 的知識和推理能力來指導多智能體強化學習 (MARL) 智能體,以實現更高效、安全的協同駕駛。
1