本研究では、現実世界のCACC(Cooperative Adaptive Cruise Control)システムにおいて発生する遅延問題に着目し、遅延を考慮した多エージェント強化学習(MARL)フレームワークを提案している。
まず、CACC車両群の意思決定プロセスをMulti-Agent Delay-Aware Markov Decision Process (MADA-MDP)としてモデル化し、中央集中型の学習と分散型の実行(CTDE)を行うMARL手法を開発した。
次に、注意機構を組み込んだ方策ネットワークを導入し、各CAV車両の通信と意思決定の性能を向上させた。さらに、速度最適化モデルに基づくアクションフィルタを組み込むことで、車両群の安定性をさらに高めている。
実験結果から、提案手法は様々な遅延条件や車両群サイズにおいて、ベースラインの手法と比較して、車両群の安全性、安定性、全体的なパフォーマンスが優れていることが示された。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania