核心概念
大規模な都市環境でのタクシー配送問題において、安定した政策を実現するための近似マルチエージェントアルゴリズムが提案されました。
要約
この論文では、未来の乗車要求を考慮しながら、大規模な都市環境で協力的な多エージェントポリシーを学習する手法が提案されています。提案されたアルゴリズムは、予測される需要とユーザーの計算リソースに基づいて地図をセクターに分割し、安定性を保ちつつ計算コストを削減します。数値結果は、理論的条件を満たすフリートサイズで安定性が達成されることを示しています。また、提案手法は全体地図上での一度に行うロールアウトと比較して低いランタイムで同等のパフォーマンスを達成しています。
統計
フリートサイズ m が十分である IA の安定性条件を特徴付けます。
m の必要条件は無限時間における IA の安定性を維持するために導かれます。
引用
"最近の理論は、ロールアウトの1段階先読みコスト最小化がニュートンステップとして機能し、最適ポリシーへ超線形収束することを示しています。"
"提案手法は、予測される需要とユーザー指定の計算制約に基づいて地図を分割し、2段階アルゴリズムを実行します。"
"我々は理論的結果から得られる十分な条件に基づいて m を見つけ出しました。"
"提案手法は計算コストが低く、全体地図上で一度に行うロールアウトと同等以上のパフォーマンスを発揮します。"