Core Concepts
深層強化学習を用いて、状況に応じてコスト関数の重みを動的に調整することで、ロボットの社会的に適切な経路計画を実現する。
Abstract
本研究では、ロボットの社会的に適切な経路計画を実現するために、深層強化学習を用いた適応型ソーシャルフォースウィンドウプランナーを提案している。
まず、ダイナミックウィンドウアプローチ(DWA)に社会的コストを加えたソーシャルフォースウィンドウ(SFW)プランナーを基本的な手法として用いる。SFWプランナーでは、ソーシャルフォースモデルに基づいて人間との相互作用を考慮したコスト関数を定義している。
次に、深層強化学習のエージェントを導入し、状況に応じてコスト関数の重みを動的に調整することで、SFWプランナーの適応性を高めている。具体的には、ゴール情報、前回の重み、人間の位置・速度情報、LiDARデータなどを状態として入力し、コスト関数の重みを出力するニューラルネットワークを学習させる。
実験では、様々な社会的状況を想定したシミュレーション環境で評価を行っている。その結果、提案手法であるSFW-SACは、従来手法であるDWAやSFWに比べて、成功率、経路長、平均速度、社会的影響度の観点で優れた性能を示すことが確認された。特に、狭い空間や混雑した環境においても適応的に振る舞うことができることが示された。
Stats
ロボットと人間の相互作用による社会的コスト(Social Work)は、DWAに比べSFW-SACが低い。
人間の個人領域への侵入時間の割合は、SFW-SACがSFWと同程度に抑えられている。
Quotes
"深層強化学習を用いて、状況に応じてコスト関数の重みを動的に調整することで、ロボットの社会的に適切な経路計画を実現する。"
"提案手法であるSFW-SACは、従来手法であるDWAやSFWに比べて、成功率、経路長、平均速度、社会的影響度の観点で優れた性能を示す。"