Core Concepts
本研究では、ラベル付きデータが限られている状況でも、ラベルなしデータを活用することで、頑健な群衆数え上げモデルを構築する半教師あり学習フレームワークを提案する。
Abstract
本研究は、群衆数え上げの半教師あり学習フレームワークを提案している。
- 提案手法は、ラベル付きデータとラベルなしデータの両方を活用することで、頑健な群衆数え上げモデルを構築する。
- 具体的には以下の3つの主要な要素から成る:
- 2つの自己教師あり損失関数(Crowd Scale Equivariance、Crowd Entropy Consistency)を提案し、群衆の変化(スケール、照明など)をモデル化する。
- Gated-Crowd-Recurrent-Unit (GCRU)を提案し、群衆の高次統計量を抽出することで、高品質の疑似ラベルを生成する。
- 教師あり損失と教師なし損失を動的に重み付けする学習戦略を採用し、モデルの頑健性を高める。
- 4つのデータセットで実験を行い、提案手法が既存の半教師あり学習手法を上回る性能を示した。
Stats
1535枚の画像からなるUCF QNRF データセットの注釈には2000人時間を要した。
ShanghaiTech Aデータセットの300枚の訓練画像に対して、提案手法は82.1のMAEを達成した。
ShanghaiTech Bデータセットの120枚の訓練画像に対して、提案手法は10.9のMAEを達成した。
Quotes
"密集群衆の自動分析は、スマートシティ構築に役立つ日常の交通統計と計画に効果的に適用できる。"
"既存のCNN密度ベースの群衆数え上げ手法は、ラベル付きデータに大きく依存しており、ラベル付けは労力と時間を要する。"