Основные понятия
本論文では、単純な構造ながら高精度な群衆カウンティングを実現するFuss-Free Network (FFNet)を提案する。FFNetは、バックボーンネットワーク、マルチスケールフュージョン構造、フォーカス遷移モジュールから構成される。実験結果は、複雑なモデルと比較して、パラメータ数とコンピューティングリソースが大幅に削減されながら、群衆カウンティングの精度を維持または向上させることを示している。
Аннотация
本論文では、群衆カウンティングのための新しいモデルであるFuss-Free Network (FFNet)を提案している。FFNetは以下の3つの主要コンポーネントから構成される:
-
特徴抽出バックボーン: ConvNeXt-Tinyネットワークを使用し、マルチブランチ構造によりマルチスケールの特徴を抽出する。
-
フォーカス遷移モジュール: 動的畳み込みを活用し、チャンネルとスペースの両方の特徴を最適化する。これにより、重要な特徴を効率的に抽出し、次のフュージョンステージに渡すことができる。
-
マルチスケールフュージョン: 3つのブランチの特徴を単純な連結フュージョンで統合する。これにより、異なるスケールの特徴を効果的に組み合わせることができる。
実験結果は、FFNetが複雑なモデルと比較して、パラメータ数とFLOPSが大幅に削減されながら、群衆カウンティングの精度を維持または向上させることを示している。これは、モデルの複雑性と性能の関係を適切にバランスさせた成果である。さらに、フォーカス遷移モジュールとマルチスケールフュージョンの有効性も実証された。
Статистика
群衆カウンティングの精度は、モデルの複雑性と密接に関係している。しかし、本論文のFFNetは、複雑なモデルと比較して、パラメータ数が29.02Mと大幅に少なく、FLOPSも23.67Gと低い。
一方で、FFNetは以下の群衆カウンティング精度を達成している:
UCF CC 50データセットでMAE 161.1
ShanghaiTech Part AデータセットでのMAE 48.3
ShanghaiTech Part Bデータセットでのマ 6.1
NWPU-Crowdデータセットでのマ 41.2
Цитаты
"本論文では、単純な構造ながら高精度な群衆カウンティングを実現するFuss-Free Network (FFNet)を提案する。"
"実験結果は、FFNetが複雑なモデルと比較して、パラメータ数とFLOPSが大幅に削減されながら、群衆カウンティングの精度を維持または向上させることを示している。"