本論文では、ディープ強化学習(DRL)を用いたナビゲーションアルゴリズムの
転移可能性を定量化するための新しいメトリックを提案している。
まず、訓練シーンと実験シーンの類似度を表す「グローバルシーン類似度」と
「ローカルシーン類似度」の2つの指標を設計した。グローバルシーン類似度は
DRLナビゲーションアルゴリズムの全体的な堅牢性を評価し、ローカルシーン
類似度はグローバルマップなしでの安全性を示す指標として機能する。
次に、2D LiDARデータ、エージェントの位置、目的地の位置を融合したローカル
マップを観測入力とするDRLナビゲーションアルゴリズムを提案した。このアルゴリズム
は、LiDARセンサの視野角や角度分解能を変更しても堅牢に動作する。
シミュレーションと実環境での実験結果から、提案したシーン類似度メトリックが
DRLナビゲーションアルゴリズムの転移可能性を適切に定量化できることを示した。
また、ローカルマップを観測入力とするDRLナビゲーションアルゴリズムが、
従来のベクトル型の観測入力よりも優れた転移性能を発揮することを確認した。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы