Core Concepts
静止カメラ撮影動画における静止点の位置ずれと擬似追跡の問題を解決するため、カメラ動きの検出と移動物体領域の特定に基づいた点追跡手法を提案した。
Abstract
本報告は、ICCV 1st Perception Test Challenge 2023の点追跡タスクに対する解決策を提案している。
まず、TAPIR手法をベースラインとして採用し、その問題点を分析した。TAPIR手法では、静止カメラ撮影動画における静止点の位置ずれ(ジッター)と擬似追跡の問題が見られた。
そこで著者らは、以下の2つの主要な手法を提案した:
多粒度カメラ動き検出アルゴリズム
動画全体と短時間クリップの両方でフレーム間の類似度を評価し、静止カメラ撮影動画と移動カメラ撮影動画を判別する。
CMRベースの点軌跡予測
静止カメラ撮影動画では、移動物体領域(Confident Moving Region: CMR)を特定し、その領域内の点のみTAPIRで予測する一方、CMR外の静止点は静止ベースラインで予測する。
これにより、静止点の位置ずれと擬似追跡を効果的に抑制できる。
提案手法の実験結果では、静止カメラ撮影動画における平均Jaccard指標が大幅に向上し、全体の性能も改善された。一方、移動カメラ撮影動画への適用には課題が残されている。
Stats
静止カメラ撮影動画における平均Jaccard指標は47.19であり、ベースラインの44.40から大幅に向上した。