Завантажити Linnk AI
•
Помічник з досліджень
>
Увійти
ідея
-
分散式交通信号灯控制
交通信号灯的分散式强化学习控制方法MetaVIM
提出了一种基于元学习的分散式强化学习方法MetaVIM,通过引入潜在变量来表示任务特定信息,并设计了一种内在奖励机制来提高政策学习的稳定性,从而实现了在大规模道路网络中的有效控制。
1