本研究は、クラシックなナビゲーションアルゴリズムと深層強化学習を組み合わせることで、自律移動ロボットのナビゲーションシステムの性能を向上させることを目的としている。
クラシックなナビゲーションアルゴリズムは安全性を保証できるが、人間の行動様式に適応できないという課題がある。一方、深層強化学習ベースのアプローチは人間の行動を模倣できるが、安全性の保証が難しい。
本研究では、クラシックなDWAプランナーの出力を活用して深層強化学習のアクターを正則化することで、サンプル効率の向上と人間適応性の向上を実現している。さらに、クラシックなプランナーをフォールバックシステムとして組み込むことで、安全性を担保している。
具体的な手順は以下の通り:
この手法により、安全性と人間適応性を両立した自律移動ロボットのナビゲーションシステムを実現できることが示された。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問