Core Concepts
クラシックなナビゲーションアルゴリズムと強化学習を組み合わせることで、安全性と人間適応性を両立した自律移動ロボットのナビゲーションシステムを実現する。
Abstract
本研究は、クラシックなナビゲーションアルゴリズムと深層強化学習を組み合わせることで、自律移動ロボットのナビゲーションシステムの性能を向上させることを目的としている。
クラシックなナビゲーションアルゴリズムは安全性を保証できるが、人間の行動様式に適応できないという課題がある。一方、深層強化学習ベースのアプローチは人間の行動を模倣できるが、安全性の保証が難しい。
本研究では、クラシックなDWAプランナーの出力を活用して深層強化学習のアクターを正則化することで、サンプル効率の向上と人間適応性の向上を実現している。さらに、クラシックなプランナーをフォールバックシステムとして組み込むことで、安全性を担保している。
具体的な手順は以下の通り:
DWAプランナーの出力を活用して深層強化学習のアクターを正則化することで、サンプル効率の向上と人間適応性の向上を実現する。
クラシックなプランナーをフォールバックシステムとして組み込み、危険な状況では自動的にクラシックなプランナーに切り替えることで安全性を担保する。
この手法により、安全性と人間適応性を両立した自律移動ロボットのナビゲーションシステムを実現できることが示された。
Stats
ロボットの速度が高い場合、Supervisorの半径を大きくする必要がある。
ロボットの速度が低い場合、Supervisorの半径を小さくする必要がある。