Core Concepts
ローカルトポロジー特徴を学習するローカルポリシーと、全体情報を学習するグローバルポリシーを組み合わせたアンサンブル手法により、車両ルーティング問題に対する一般化性能を大幅に向上させることができる。
Abstract
本論文では、車両ルーティング問題(VRP)を解決するための一般化可能なニューラルソルバーを提案している。従来のニューラルソルバーは、単一の合成問題インスタンスに特化しており、複雑な実世界の問題に対する一般化性能が低いという課題があった。
提案手法では、以下の2つのポリシーを組み合わせたアンサンブル手法を用いる:
グローバルポリシー: VRPの全体情報を学習し、高い学習能力を持つ。従来手法のPOMOを採用。
ローカルポリシー: 現在ノードの近傍ノードのみに着目し、ノード分布や問題規模に依存しない転移可能な特徴を学習する。
ローカルポリシーは、ノードの極座標表現や距離ペナルティなどの工夫により、効率的に局所的な最適解を見つけることができる。
グローバルポリシーとローカルポリシーを共同学習することで、両者の長所を活かし、複雑な分布や大規模な問題に対する一般化性能を大幅に向上させることができる。
実験では、TSPとCVRPのベンチマークデータセットで提案手法の優位性を示し、さらに実世界の大規模問題でも良好な性能を発揮することを確認した。
Stats
提案手法ELG-POMOは、CVRPLIB Set-Xの(200, 1000]の問題規模で、最良手法Omni-POMOに比べて0.49%のギャップ削減を達成した。
同様に、TSPLIBの(200, 1002]の問題規模で、1.50%のギャップ削減を達成した。
実世界の大規模CVRP問題(N∈[3000, 7000])でも、他手法に比べて優れた性能を示した。
Quotes
"ローカルな近傍ノードを含む小規模な問題を効率的に解くことができれば、ノード分布や問題規模に依存しない転移可能な特徴を学習できる可能性がある。"
"グローバルポリシーとローカルポリシーを共同学習することで、両者の長所を活かし、一般化性能を大幅に向上させることができる。"