Core Concepts
MOTを超えるために、セマンティック理解を統合した新しいトラッキングパラダイムであるSMOTが導入されました。
Abstract
現在のMOTは、動画内のターゲットの軌跡を予測することに焦点を当てています。しかし、多くの重要なアプリケーションでは、「どこ」だけでは不十分です。そのため、本研究では「どこ」と「何」を統合して、動画理解のためのセマンティックマルチオブジェクトトラッキング(SMOT)が紹介されました。BenSMOTという大規模なベンチマークも提案され、将来の研究を促進することが期待されています。
Stats
BenSMOTは3,292本の動画と151Kフレームから成ります。
BenSMOTには7.8K以上のインスタンスが含まれ、335K個以上のバウンディングボックスがあります。
SMOTerは良好なパフォーマンスを示しました。
Quotes
"BenSMOTは初めて公開されたSMOT向けのベンチマークです。"
"SMOTerは特別に設計されたエンドツーエンドで訓練されたトラッカーです。"