大規模ビジョン言語モデルは自動運転の解釈可能性を大幅に向上させましたが、現在の評価は一般的なシナリオに焦点を当てており、自動運転のコーナーケースに対する定量的な評価が不足しています。本研究では、CODA-LMと呼ばれる新しいベンチマークを提案し、強力な言語モデルを評価者として採用することで、ビジョン言語モデルの自動運転コーナーケースに対する理解を包括的に評価しています。