核心概念
遅延を考慮した多エージェント強化学習フレームワークを提案し、注意機構と最適化モデルに基づくアクションフィルタを導入することで、CACC車両群の安全性と安定性を向上させる。
要約
本研究では、現実世界のCACC(Cooperative Adaptive Cruise Control)システムにおいて発生する遅延問題に着目し、遅延を考慮した多エージェント強化学習(MARL)フレームワークを提案している。
まず、CACC車両群の意思決定プロセスをMulti-Agent Delay-Aware Markov Decision Process (MADA-MDP)としてモデル化し、中央集中型の学習と分散型の実行(CTDE)を行うMARL手法を開発した。
次に、注意機構を組み込んだ方策ネットワークを導入し、各CAV車両の通信と意思決定の性能を向上させた。さらに、速度最適化モデルに基づくアクションフィルタを組み込むことで、車両群の安定性をさらに高めている。
実験結果から、提案手法は様々な遅延条件や車両群サイズにおいて、ベースラインの手法と比較して、車両群の安全性、安定性、全体的なパフォーマンスが優れていることが示された。
統計
遅延時間は通信遅延、センサ遅延、アクチュエータ遅延の合計で0.5秒である。
最小安全車間距離hminは1m、最大速度vmaxは30m/s、最大加速度umaxは2.0m/s2、最大減速度uminは-2.0m/s2である。
引用
"遅延問題は現実世界のCACC(Cooperative Adaptive Cruise Control)システムにおいて発生する重要な課題であるが、従来のRL(強化学習)ベースのアプローチではほとんど考慮されていない。"
"提案手法は、注意機構を組み込んだ方策ネットワークと最適化モデルに基づくアクションフィルタを導入することで、CACC車両群の安全性と安定性を大幅に向上させることができる。"