Core Concepts
本研究では、深層強化学習を用いて、不確実性下のジョブショップスケジューリング問題に対する堅牢なスケジュールを生成する新しいアプローチを提案する。
Abstract
本論文は、ジョブショップスケジューリング問題(JSSP)に取り組むための新しいアプローチを提案している。JSSPは、タスクを機械に割り当てることで、メイクスパンや遅延などの基準を最小化することを目的とする組合せ最適化問題である。
提案手法の主な特徴は以下の通りである:
深層強化学習(DRL)を用いて、JSSPに対する解決策を学習する。これにより、一般化性と拡張性が向上する。
不確実な期間を持つJSSPに対処するための新しい方法を提案する。
具体的には、グラフニューラルネットワーク(GNN)とDRLを組み合わせたWheatleyアプローチを開発した。このアプローチは、部分スケジュールをグラフとして表現し、GNNを使ってノードとエッジの特徴を抽出する。DRLアルゴリズムであるPPOを用いて、このグラフ表現に基づいて最適なスケジューリング決定を学習する。
不確実性への対処では、各タスクの期間を確率分布で表現し、完全なスケジュールが得られた時点でのみ実際の期間を観測する。これにより、期待メイクスパンを最小化するポリシーを学習できる。
提案手法は、既存のベンチマークに対して優れた性能を示し、特に不確実性下のJSSPでは従来手法を大きく上回る結果を得ている。また、大規模な問題に対しても良好な一般化性を示している。
Stats
タスクの期間は三角分布に従う。
最小期間は期待期間の95%、最大期間は期待期間の110%の範囲にある。