本論文は、旅行購買者問題(TPP)に対する新しいアプローチを提案している。TPPは、製品需要を満たすべく、一部の市場を訪問して製品を購入する経路を決定する組合せ最適化問題である。
提案手法の特徴は以下の通り:
経路構築と購買計画を分離して扱う。経路構築はポリシーネットワークで行い、購買計画は線形計画問題で解く。これにより、複雑な同時最適化を回避しつつ、全体最適化を目指す。
バイパーティート・グラフによる問題表現を提案する。市場ノードと製品ノードを持つグラフで、市場の供給量や価格を辺の特徴量として表現する。これにより、市場と製品の関係性を効果的にモデル化できる。
グラフニューラルネットワークと注意機構を用いたポリシーネットワークを設計する。バイパーティート・グラフの構造を活用し、市場と製品の関係性を抽出して経路構築に活用する。
メタ学習に基づく訓練戦略を提案する。小規模問題で初期化したポリシーネットワークを、大規模問題への適応性と汎化性を高めるように訓練する。
これらの特徴により、提案手法は既存の启发式手法に比べて大幅な最適性ギャップの改善と計算時間の短縮を実現できる。特に大規模問題に対する優位性が確認された。
翻譯成其他語言
從原文內容
arxiv.org
深入探究