Core Concepts
学習したコントローラを活用し、ロードマップ上の局所目標を選択することで、動力学を考慮した効率的な経路計画を実現する。
Abstract
本研究は、動力学を考慮した効率的な経路計画を実現するために、学習したコントローラを活用するアプローチを提案する。
オフラインでは以下の2つのステップを行う:
空の環境でコントローラを学習する。
目標環境でロードマップを構築する。ロードマップの頂点は環境の自由空間の構成、エッジはコントローラで接続可能な頂点間を表す。ただし、コントローラは完全に頂点間を接続できないため、ギャップが生じる。
オンラインでは、新しい経路計画問題に対して以下を行う:
開始点と目標点をロードマップに追加する。
ロードマップ上の波面を計算する。
選択した木の展開ノードに対して、ロードマップ上の最も低コストの到達可能な局所目標を見つける。
学習したコントローラを使ってその局所目標に到達するよう制御入力を生成する。
コントローラが局所目標に到達できない場合は、ランダムな探索を行う。
この手法は、理論的な保証を維持しつつ、学習したコントローラの情報を活用することで、効率的な経路計画を実現する。
評価実験では、2次系の車両モデルや物理シミュレーションを用いた複雑な環境で、提案手法が従来手法に比べて高速に低コストの解を見つけられることを示している。
Stats
RLGの解のコスト: 79.01秒
RoGuEの解のコスト: 47.05秒