本論文は、交差都市信号制御のための強化学習ベースのアプローチを提案している。従来の強化学習手法は単一の都市内での性能は良いものの、新しい都市への適用には課題があった。
提案手法X-Lightは、Transformer on Transformerモデルを用いて、以下の2つの課題を同時に解決する:
複数の信号機の協調: Lower Transformerは、各信号機とその近隣の観測、行動、報酬の関係を学習し、信号機間の協調を促進する。従来のGNNベースの手法と比べ、6-13%の性能向上を示す。
都市間の汎化性: Upper Transformerは、複数都市の履歴情報から一般的な意思決定プロセスを学習する。これにより、新しい都市への適用時にも優れた性能を発揮する。ベースラインと比べ、平均7.91%、最大16.3%の性能向上を示す。
さらに、動的予測タスクの導入や、観測情報との残差接続などの工夫により、学習の安定性と性能を向上させている。
実験では、7つの都市シナリオを用いて評価を行い、提案手法の優れた汎化性と高い性能を実証している。
翻譯成其他語言
從原文內容
arxiv.org
深入探究