本研究では、自律走行車(AV)と人間運転車(HDV)が混在する交通環境において、AVの速度制御を通じて渋滞を緩和する新しいアプローチを提案している。具体的には以下の通り:
問題をDecentralized Partially Observable Markov Decision Process (Dec-POMDP)としてモデル化し、マルチエージェントロールアウトアルゴリズムを開発した。これにより、AVの協調的な意思決定を実現し、動的な環境変化にも柔軟に適応できる。
Agent-by-Agent Policy Iteration (A2PI)を用いて、各AVの方策を順次更新することで、エージェント間の協調を促進し、全体の性能向上につなげている。
Proximal Policy Optimization (PPO)アルゴリズムを組み合わせることで、方策の安定的な改善を実現している。
実際の高速道路ネットワークを用いた検証実験の結果、AVの導入率10%の条件下で、ボトルネック区間の平均旅行時間を9.42%改善できることを示した。
このように、本手法は混合自動運転環境における渋滞緩和に有効であり、AVの協調制御を通じて交通流の最適化を実現している。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania