Concepts de base
プラットフォームに依存しない知覚モジュールとDRLコントロールモジュールを組み合わせたロバストなDRLフレームワークを提案し、シミュレーションから現実世界への円滑な転移を実現する。
Résumé
本研究では、プラットフォームに依存しない知覚モジュールとDRLコントロールモジュールから成るロバストなDRLフレームワークを提案している。知覚モジュールは、タスクに関連する情報を抽出し、DRLエージェントに提供することで、シミュレーションから現実世界への円滑な転移を実現する。
DRLエージェントは、知覚モジュールから得られる情報を利用して、シミュレーション上でレーン追従とオーバーテイクの行動を学習する。評価の結果、提案手法のエージェントは、シミュレーション上でPIDコントローラやヒューマンプレイヤーを上回る性能を示し、現実世界でも安定した走行を実現できることが確認された。さらに、他のDRLベースラインと比較しても、提案手法のエージェントが優れた堅牢性を発揮することが示された。
Stats
車線追従タスクにおいて、提案手法のDRLエージェントは、PIDコントローラと比べて最大65%高速な平均速度を達成した。
車線追従タスクにおいて、提案手法のDRLエージェントは、3台の実機ロボットで評価した結果、1回の逸脱しか発生しなかった。
オーバーテイクタスクにおいて、提案手法のDRLエージェントは、3つの評価マップで90%以上の成功率を達成した。
Citations
"プラットフォームに依存しない知覚モジュールとDRLコントロールモジュールから成るロバストなDRLフレームワークを提案し、シミュレーションから現実世界への円滑な転移を実現する。"
"提案手法のDRLエージェントは、シミュレーション上でPIDコントローラやヒューマンプレイヤーを上回る性能を示し、現実世界でも安定した走行を実現できることが確認された。"
"提案手法のDRLエージェントが、他のDRLベースラインと比較しても優れた堅牢性を発揮することが示された。"