本論文では、現実世界のデータ不足を補うため、高品質な合成データ(ARSim)を自動生成し、多視点一貫性を維持しながら実データに統合する手法を提案している。
まず、入力となる実データから3Dシーンを再構築し、光分布を推定する。次に、対象物体の3Dモデルを配置し、カメラパラメータを用いて各フレームにレンダリングする。これにより、現実世界のデータに合成物体を自然に統合し、多視点一貫性を保ちつつ、ラベル情報も生成できる。
提案手法を用いて、障害物検知、自由空間検知、駐車検知の3つの自動運転知覚タスクで評価を行った。その結果、ARSimデータを組み合わせることで、各タスクの性能指標が大幅に向上することが示された。特に、歩行者や自転車などの稀少なクラスの検知精度が大きく改善された。
また、完全合成データ(VRSim)と提案手法のARSimデータを比較した実験でも、ARSimデータの有効性が確認された。ARSimは現実世界のデータとの間のドメインギャップを効果的に埋めることができ、合成データの性能を大幅に向上させることができる。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Aqeel Anwar,... um arxiv.org 03-25-2024
https://arxiv.org/pdf/2403.15370.pdfTiefere Fragen