本研究では、エンドツーエンドの自動運転知覚モデルの内部メカニズムを解明するため、独立機能モジュール評価フレームワーク(BEV-IFME)を提案した。
BEV-IFMEでは、機能モジュールの出力特徴マップとグラウンドトゥルースを統一的な意味表現空間にマッピングし、その類似度を定量的に評価することで、個別の機能モジュールの学習状況を把握する。
具体的には、大規模言語モデルを用いてグラウンドトゥルースを意味表現空間にエンコーディングし、提案する二段階アラインメントオートエンコーダを使って特徴マップも同様の表現空間に写像する。
この意味表現空間上での類似度を「Similarity Score」として定義し、これが最終的な検出精度指標(mAP、NDS)と高い正の相関を示すことを実験的に確認した。
これにより、BEV-IFMEが個別の機能モジュールの学習状況を正確に反映し、モジュール単位での最適化に活用できることが示された。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések