该论文提出了一种名为Multi-Agent Game-prior Attention Deep Deterministic Policy Gradient (MA-GA-DDPG)的新算法,用于解决CAVs在无信号交叉口的合作决策问题。
首先,该算法将CAVs在无信号交叉口的决策问题建模为一个分散式的多智能体强化学习问题。每个CAV被建模为一个智能体,可以与其他智能体进行交互和协作。
为了捕捉ego CAV与其他智能体之间的交互依赖关系,算法采用了注意力机制。注意力权重被用来筛选交互对象,并获得基于层级博弈的优先级先验。
此外,算法还设计了一个基于注意力权重和层级博弈的安全监督模块,能够预测并检测潜在的冲突,并实时对CAV的行为进行纠正,提高算法的学习效率和安全性。
算法还考虑了交通环境中人类驾驶员的异质性,通过大量的仿真和硬件实验验证了算法在安全性、效率和舒适性方面的优越性。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Jiaqi Liu, P... a las arxiv.org 09-10-2024
https://arxiv.org/pdf/2409.05712.pdfConsultas más profundas