Core Concepts
複雑な動的環境における複数の独立した運動を同時に推定し、センサーの自己運動と第三者の運動を分離する。
Abstract
本論文は、Multimotion Visual Odometry (MVO)と呼ばれる多モーション推定パイプラインを提案している。MVOは、従来の視覚オドメトリ (VO) パイプラインを拡張し、多モーション分割とトラッキング手法を導入することで、センサーの自己運動と環境中の第三者運動を同時に推定する。
MVOの特徴は以下の通り:
外観情報に依存せず、運動情報のみを利用して複数の独立した運動を推定する。
物体の数、外観、運動に関する事前情報を必要としない。
物理的に妥当な運動モデルを用いて、一時的な遮蔽下でも運動を外挿し、再出現を検出できる。
実世界のデータセットで良好な推定精度を示す。
MVOのパイプラインは以下の手順で構成される:
3Dトラックレットを用いて、運動ラベルの提案と割り当てを繰り返し行い、運動分割を行う。
運動分割が収束したら、ラベルを整理し、センサーの自己運動を特定する。
センサーの自己運動を基準とした第三者運動の geocentric な軌道を推定する。
運動の再出現を検出するためのモーションクロージャーを適用する。
提案手法は、複雑な動的環境における多モーション推定の課題に対して、一般化された解決策を示している。
Stats
観測点の再投影誤差が閾値以下の点数が最も多くなるように、フレーム間の運動を RANSAC で推定する。
運動ラベルの支持点数が最小閾値以下、または最小フレーム数以下の場合、そのラベルは除去される。
Quotes
"MVO addresses the MEP by casting motion segmentation as a multilabeling problem where a label represents a motion trajectory. It iteratively segments and estimates motions using these labels in an alternating fashion until the segmentation converges."
"MVO does not use any assumptions or heuristics to identify the static background until after the segmentation converges, so each motion is estimated as if it corresponds to the true egomotion."
"MVO fully addresses the MEP in an online manner using only a rigid-motion assumption. The pipeline estimates the full SE(3) trajectory of every motion in a complex, dynamic scene without any a priori information about object number, appearance, or motion."