แนวคิดหลัก
M2Depthは、自動運転シーンにおける信頼性の高い周辺環境の3D表現を実現するための、新しい自己教師あり2フレーム多視点メトリック深度推定ネットワークである。
บทคัดย่อ
M2Depthは、自動運転シーンにおける周辺環境の3D表現を目的としたネットワークである。従来の手法は単一視点の単一フレームや複数フレームの単一カメラを入力としていたが、M2Depthは時間的に隣接した2フレームの多視点画像を入力とし、高品質な周辺深度を推定する。
具体的には以下の特徴を持つ:
- 空間的・時間的な3Dコストボリュームを構築し、空間時間融合モジュールを提案することで、空間時間情報を統合して深度推定精度を向上させる。
- セグメントエニシングモデル(SAM)の特徴を深度推定に導入し、多粒度特徴融合モジュールを提案することで、細かな意味情報を活用して深度の質を高める。
実験結果では、nuScenes及びDDADベンチマークにおいて、最先端の性能を達成している。特に、多視点間の深度の整合性が高く、従来手法に比べて優れた3D表現を実現できることが示された。
สถิติ
自動運転シーンにおける深度範囲は一般に大きいため、事前深度推定を活用して深度サンプリング範囲を適応的に絞り込むことで、効率的な深度推定が可能となる。
空間的隣接カメラ間の三角測量を用いて、初期段階の深度・姿勢推定の精度を高めることができる。
คำพูด
"M2Depthは、自動運転シーンにおける信頼性の高い周辺環境の3D表現を実現するための、新しい自己教師あり2フレーム多視点メトリック深度推定ネットワークである。"
"M2Depthは、空間的・時間的な3Dコストボリュームを構築し、空間時間融合モジュールを提案することで、空間時間情報を統合して深度推定精度を向上させる。"
"M2Depthは、セグメントエニシングモデル(SAM)の特徴を深度推定に導入し、多粒度特徴融合モジュールを提案することで、細かな意味情報を活用して深度の質を高める。"