核心概念
TrackSSMは、履歴トラジェクトリの位置と運動情報を利用して、データ依存型の状態空間モデルを用いて時間的な運動予測を行う統一的なエンコーダ-デコーダフレームワークである。
要約
本論文では、TrackSSMと呼ばれる新しい多オブジェクト追跡のための時間的運動モデルを提案している。TrackSSMは以下の特徴を持つ:
-
Flow-SSMモジュール: 履歴トラジェクトリの位置と運動情報を利用して、オブジェクトバウンディングボックスの時間的状態遷移を誘導する。
-
フロー デコーダ: Flow-SSMを用いて、履歴フレームのトラジェクトリから得られたフロー情報を利用して、トラジェクトリの時間的位置予測を行う。
-
ステップバイステップ線形(S2L)トレーニング戦略: 前フレームとの線形補間によってプソードラベルを生成し、フロー情報がバウンディングボックスの時間的遷移をより正確に誘導できるようにする。
これらの設計により、TrackSSMは簡単かつ効果的な運動モデルを実現し、様々な追跡シナリオに適用可能で、複数のベンチマークで優れた追跡性能を達成している。
統計
提案手法TrackSSMは、YOLOX-lデテクタと組み合わせることで、27.5 FPSの推論速度を達成する。
ByteTrackにTrackSSMを統合すると、MOT17テストセットでは性能に変化がなく、DanceTrackテストセットでは+10.9 HOTA、SportsMOTテストセットでは+11.0 HOTAの性能向上が得られる。
引用
"TrackSSMは、履歴トラジェクトリの位置と運動情報を利用して、データ依存型の状態空間モデルを用いて時間的な運動予測を行う統一的なエンコーダ-デコーダフレームワークである。"
"Flow-SSMモジュールは、履歴トラジェクトリの位置と運動情報を利用して、オブジェクトバウンディングボックスの時間的状態遷移を誘導する。"
"ステップバイステップ線形(S2L)トレーニング戦略は、前フレームとの線形補間によってプソードラベルを生成し、フロー情報がバウンディングボックスの時間的遷移をより正確に誘導できるようにする。"