複雑な倉庫レイアウトにおいて、倉庫ロボットの効率的かつ正確なナビゲーションを実現するために、Proximal Policy Optimization (PPO) とダイクストラ法を組み合わせた新しいナビゲーションアルゴリズム、Proximal Policy-Dijkstra (PP-D) を提案する。