本研究は、実世界の人間の運転データと合成データを組み合わせた自動運転のためのオフラインリインフォースメントラーニングのベンチマークを提供する。提案するPOMDPモデルは、様々な運転シナリオに適用可能であり、最新のオフラインリインフォースメントラーニングアルゴリズムの性能を評価する。