最近のコンピュータビジョンコミュニティの進歩により、密なオブジェクトカウントや群衆カウントは大きく進化してきました。しかし、周囲と混ざっているターゲットの数を数える見えないオブジェクトカウントは課題でした。画像ベースのオブジェクトカウントデータセットが主流であったため、YoutubeFish-35という大規模なデータセットが提案されました。このデータセットには、高解像度ビデオシーケンス35本が含まれており、選択したさまざまなシーンで150,000以上の注釈付き中心点があります。新しく収集されたデータセットで3つの主要な方法を選択し、慎重に評価しました。TransVidCountは、密度と回帰ブランチを組み合わせて不明瞭なオブジェクトカウントに取り組む新しい強力なベースラインです。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Cheng-Yen Ya... um arxiv.org 03-07-2024
https://arxiv.org/pdf/2403.03461.pdfTiefere Fragen