Centrala begrepp
動的な動画から2Dポイントトラックを利用して、3D非剛体構造とカメラ位置を単一の推論で推定する。
Sammanfattning
本研究は、動的な動画から3D非剛体構造とカメラ位置を推定する新しい深層学習ベースのアプローチ「TracksTo4D」を提案する。
入力は2Dポイントトラックのみで、3D監督信号は使用しない
対称性を考慮した等変換ニューラルネットワークアーキテクチャを設計
剛体部分と非剛体部分を分離して推定することで、カメラ位置の推定を安定化
実験では、事前学習したモデルが未知のカテゴリの動画でも良好な一般化性能を示す
従来手法と比べて高速な推論時間を実現
Statistik
動的な部分の絶対的な深度誤差は0.11
全体の絶対的な深度誤差は0.08
動的な部分の深度の1.25倍以内の精度は0.88
全体の深度の1.25倍以内の精度は0.92
Citat
"我々は動的な動画から2Dポイントトラックを利用して、3D非剛体構造とカメラ位置を単一の推論で推定する新しい深層学習ベースのアプローチ「TracksTo4D」を提案する。"
"TracksTo4Dは、対称性を考慮した等変換ニューラルネットワークアーキテクチャを設計し、剛体部分と非剛体部分を分離して推定することで、カメラ位置の推定を安定化する。"