核心概念
本研究は、実世界の人間の運転データと合成データを組み合わせた自動運転のためのオフラインリインフォースメントラーニングのベンチマークを提供する。提案するPOMDPモデルは、様々な運転シナリオに適用可能であり、最新のオフラインリインフォースメントラーニングアルゴリズムの性能を評価する。
要約
本研究は、自動運転のためのオフラインリインフォースメントラーニングのベンチマークを提供する。
3つの現実的な運転シナリオ(高速道路、車線減少、割り込み)を導入し、FLOW フレームワークを拡張した。
人間の運転データ(NGSIM)と合成データを組み合わせた。合成データは、オンラインリインフォースメントラーニングエージェントによって生成された。
提案するPOMDPモデルは、様々な運転シナリオに適用可能である。状態、観測、行動、報酬関数を定義した。
最新のオフラインリインフォースメントラーニングアルゴリズムの性能を評価した。結果から、人間の運転データと合成データの性能が同等であることが分かった。また、合成データの質が性能に大きな影響を与えることが示された。
統計
自動車の最大縦方向位置は約2195.4フィートである。
自動車の平均長さは約14.6フィートである。
1時間あたりの平均車両数は約117台である。