Core Concepts
現実世界のデータ不足を補うため、高品質な合成データ(ARSim)を自動生成し、多視点一貫性を維持しながら実データに統合することで、自動運転知覚ネットワークの性能を向上させる。
Abstract
本論文では、現実世界のデータ不足を補うため、高品質な合成データ(ARSim)を自動生成し、多視点一貫性を維持しながら実データに統合する手法を提案している。
まず、入力となる実データから3Dシーンを再構築し、光分布を推定する。次に、対象物体の3Dモデルを配置し、カメラパラメータを用いて各フレームにレンダリングする。これにより、現実世界のデータに合成物体を自然に統合し、多視点一貫性を保ちつつ、ラベル情報も生成できる。
提案手法を用いて、障害物検知、自由空間検知、駐車検知の3つの自動運転知覚タスクで評価を行った。その結果、ARSimデータを組み合わせることで、各タスクの性能指標が大幅に向上することが示された。特に、歩行者や自転車などの稀少なクラスの検知精度が大きく改善された。
また、完全合成データ(VRSim)と提案手法のARSimデータを比較した実験でも、ARSimデータの有効性が確認された。ARSimは現実世界のデータとの間のドメインギャップを効果的に埋めることができ、合成データの性能を大幅に向上させることができる。
Stats
障害物検知の歩行者クラスにおいて、位置誤差が26.9mから25.9mに、ヨー角誤差が9.0度から7.4度に改善された。
自由空間検知の障害物クラスにおいて、絶対誤差が1.28mから1.01mに、相対誤差が29.62%から20.68%に改善された。
Quotes
"現実世界のデータ収集には課題があり、合成データの活用が重要となっている。しかし、合成データとの間のドメインギャップが課題となっている。"
"提案手法のARSimは、現実世界のデータと合成データの特性を組み合わせることで、ドメインギャップを効果的に埋めることができる。"