核心概念
TransVidCountは、水中ビデオでの見えないオブジェクト数を効果的に処理し、最新のパフォーマンスを提供します。
要約
最近のコンピュータビジョンコミュニティの進歩により、密なオブジェクトカウントや群衆カウントは大きく進化してきました。しかし、周囲と混ざっているターゲットの数を数える見えないオブジェクトカウントは課題でした。画像ベースのオブジェクトカウントデータセットが主流であったため、YoutubeFish-35という大規模なデータセットが提案されました。このデータセットには、高解像度ビデオシーケンス35本が含まれており、選択したさまざまなシーンで150,000以上の注釈付き中心点があります。新しく収集されたデータセットで3つの主要な方法を選択し、慎重に評価しました。TransVidCountは、密度と回帰ブランチを組み合わせて不明瞭なオブジェクトカウントに取り組む新しい強力なベースラインです。
統計
NC4K [1] データセット: 4,121枚の画像
COD [2] データセット: 5,066枚の画像
IOCfish5K [3] データセット: 5,637枚の画像
引用
"TransVidCountは、動的シナリオでより正確なカウントを提供する能力を示しています。"
"TransVidCountは他の画像ベース手法と比較して高度に隠れたターゲットを正確に特定できます。"
"YoutubeFish-35テスト分割結果では、TransVidCountが他の最新技術よりも優れた性能を発揮します。"