最近、深層強化学習(DRL)モデルは、経路探索問題の解決で有望な結果を示しています。しかし、ほとんどのDRLソルバーは通常、旅行セールスマン問題(TSP)などのノード経路探索問題を解決するために提案されています。一方、中国郵便配達人問題(CPP)などのアーク経路探索問題にニューラルメソッドを適用する研究は限られており、これらはTSPと比較して不規則で複雑な解空間を特徴とします。この論文では、荷重依存コスト(CPP-LC)を持つCPPに取り組みます。我々の方法は二つ折りです。第一に、CPP-LCをマルコフ決定過程(MDP)シーケンシャルモデルとして定式化します。次に、Arc-DRLと呼ばれるDRLに基づく自己回帰モデルを導入し、CPP-LC課題に効果的に対処します。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Truong Son H... kl. arxiv.org 03-05-2024
https://arxiv.org/pdf/2310.15516.pdfDybere Forespørgsler