物理ベースのシミュレーション環境で複数のエージェントを訓練し、深層ニューラルネットワークとAdvantage Actor-Criticアルゴリズムを組み合わせることで、ロボットがプッシャブルオブジェクト間で効果的にローカルパスプランニングを行う方法を提案する。