Core Concepts
本研究は、航空と地上の視点の違いを克服するための新しい人物再同定モデルを提案する。提案モデルは、3つのストリームアーキテクチャを採用し、局所的な特徴や属性情報を活用することで、高所からの視点の変化に適応し、正確な人物再同定を実現する。
Abstract
本研究は、航空と地上の視点の違いを克服するための新しい人物再同定モデルを提案している。
データセットの構築:
AG-ReID.v2データセットを構築した。このデータセットは、UAV、固定CCTVカメラ、ウェアラブルカメラから収集された100,502枚の画像で構成され、1,615人の個人を含む。
各個人には15種類の属性ラベルが付与されている。
データセットには、解像度、遮蔽、ブラー、姿勢、照明条件の変化など、実世界の課題が反映されている。
提案モデル:
3つのストリームアーキテクチャを採用した。
ストリーム1はTransformerベースの特徴抽出を行う。
ストリーム2は、頭部領域に注目し、高所からの視点の変化に適応する。
ストリーム3は属性情報を活用し、モデルの解釈性を高める。
3つのストリームを統合することで、正確な人物再同定を実現する。
実験結果:
提案モデルは、既存の手法と比較して優れた性能を示した。
特に、航空-地上間の人物再同定タスクで高い精度を達成した。
属性情報の活用により、モデルの解釈性も向上した。
Stats
15mから45mの高度で撮影された画像の割合は、10-20m:31%、20-30m:42%、30-45m:27%である。
個人の身長(ピクセル単位)は、UAVカメラで43-739ピクセル、ウェアラブルカメラで25-1080ピクセル、CCTVカメラで23-622ピクセルの範囲にある。