本論文では、自動運転車の計画問題における分布シフトの問題に取り組むため、「Validity Learning on Failures」(VL(on failure))と呼ばれる新しい手法を提案している。
まず、あらかじめ訓練された計画アルゴリズムを様々なシナリオで実行し、安全距離の維持や交通規則の遵守などの目標から逸脱した場合を「失敗」として検出する。これらの失敗状態を収集し、新しいデータセットを構築する。
次に、この失敗データセットに対して、有効な軌道を見分けるためのVL目的関数を用いて、計画アルゴリズムを微調整する。VLは教師ラベルを必要としない弱教師学習手法であり、人手による注釈付けを必要としない。
実験評価では、CARLA シミュレーションにおいて、VL(on failure)が従来手法であるImitation Learning(IL)やIL+強化学習(RL)を大きく上回る性能を示すことを確認した。特に、閉ループでの指標であるDriving Score、Success Rate、Collision Rateなどで顕著な改善が見られた。
さらに、Bench2Driveベンチマークでも、VL(on failure)が他手法を大きく上回る結果を示した。これらの結果から、失敗データを活用することで、自動運転車の計画アルゴリズムの一般化性能を大幅に向上できることが示された。
翻譯成其他語言
從原文內容
arxiv.org
深入探究