Core Concepts
グラフ強化学習を用いて、電気自律移動サービスのリアルタイム制御を実現する。
Abstract
本論文では、電気自律移動サービス(E-AMoD)システムの運用に関する3つの主要な意思決定、すなわち、利用者の乗車要求へのマッチング、待機車両の需要の高い地域への再配置、および車両の充電管理を、グラフ強化学習を用いて効率的に行う手法を提案している。
具体的には以下の3ステップからなる階層的なアプローチを採用している:
利用者の乗車要求をマッチングする
待機車両の理想的な分布を強化学習によって決定する
2.で決定した理想分布に可能な限り近づくよう、車両の再配置と充電を最小コストで行う
この手法により、最適化ベースの手法と比べて大幅な計算時間の短縮を実現しつつ、ヒューリスティックな手法と比べても高い性能を発揮することが示されている。
さらに、学習したポリシーが他の都市や拡張エリアへの適用にも優れた汎化性能を示すことが確認された。
Stats
本手法は、理論的に最適な解の89%の利益を達成しつつ、計算時間を100倍以上短縮できる。
本手法は、最良のヒューリスティック手法と比べて、最大3.2倍の利益向上を実現する。
Quotes
"グラフ強化学習を用いることで、最適化ベースの手法と同等の性能を維持しつつ、ヒューリスティックな手法と同等の計算時間の短縮を実現できる。"
"学習したポリシーは、他の都市や拡張エリアへの適用においても優れた汎化性能を示す。"