核心概念
ロボットナビゲーションと自動運転のための高精度で実時間の全方位深度推定アルゴリズムを提案する。
要約
本論文では、ロボットナビゲーションと自動運転のための高精度で実時間の全方位深度推定システムを提案している。
提案するHexaMODEシステムは、6台のフィッシュアイカメラを搭載したロボット台車で構成されている。
提案するRtHexa-OmniMVSアルゴリズムは、効率的な球面走査手法と2Dコンボリューションネットワークを用いることで、エッジデバイス上で15FPSの推定速度を実現している。
さらに、大規模な実世界データを用いた教師-生徒型の自己学習手法を提案し、複雑な実環境における高精度、頑健性、汎化性能を実現している。
定量的・定性的な評価結果から、提案システムがロボットナビゲーションや低速自動運転に適した全方位3D知覚を実現できることが示された。
統計
提案手法のNVIDIA Orin上での推論時間は0.065秒/フレームであり、15FPSを達成している。
提案手法のパラメータ数は5.2MBで、演算量は0.496TFLOPSである。一方、教師モデルのCREStereoは5.4MB、3.630TFLOPSであり、より軽量な構造となっている。
引用
"我々は、ロボットナビゲーションと自動運転のための高精度で実時間の全方位深度推定システムを提案している。"
"提案するRtHexa-OmniMVSアルゴリズムは、効率的な球面走査手法と2Dコンボリューションネットワークを用いることで、エッジデバイス上で15FPSの推定速度を実現している。"
"さらに、大規模な実世界データを用いた教師-生徒型の自己学習手法を提案し、複雑な実環境における高精度、頑健性、汎化性能を実現している。"