本論文では、群衆カウンティングのための新しいモデルであるFuss-Free Network (FFNet)を提案している。FFNetは以下の3つの主要コンポーネントから構成される:
特徴抽出バックボーン: ConvNeXt-Tinyネットワークを使用し、マルチブランチ構造によりマルチスケールの特徴を抽出する。
フォーカス遷移モジュール: 動的畳み込みを活用し、チャンネルとスペースの両方の特徴を最適化する。これにより、重要な特徴を効率的に抽出し、次のフュージョンステージに渡すことができる。
マルチスケールフュージョン: 3つのブランチの特徴を単純な連結フュージョンで統合する。これにより、異なるスケールの特徴を効果的に組み合わせることができる。
実験結果は、FFNetが複雑なモデルと比較して、パラメータ数とFLOPSが大幅に削減されながら、群衆カウンティングの精度を維持または向上させることを示している。これは、モデルの複雑性と性能の関係を適切にバランスさせた成果である。さらに、フォーカス遷移モジュールとマルチスケールフュージョンの有効性も実証された。
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Lei Chen,Xin... lúc arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07847.pdfYêu cầu sâu hơn