Core Concepts
Robust cross-transformers network enhances person attribute recognition and retrieval tasks.
Abstract
この研究では、人物属性認識と属性ベースの人物検索のための統合されたCLEARモデルが提案されています。CLEARは、強力なクロストランスフォーマーバックボーンを使用し、グローバルレベルとローカルレベルの長距離依存関係を活用して、人物属性認識を向上させます。また、効果的なマージン学習戦略を導入して検索タスクに適応し、優れた結果を達成します。一般的に使用されるデータセットでの実験では、CLEARモデルが両方のタスクで最先端のパフォーマンスを達成し、検索タスクの基準を大幅に前進させます。
Stats
CLEAR achieves state-of-the-art performance on PA100K, PETA, RAPv2, Market-1501, and UPAR2024 datasets.
The model surpasses competitors in terms of person retrieval performance on the Market-1501 dataset.
Results show improvements in both person attribute recognition and attribute-based person retrieval tasks.
Quotes
"Another issue that needs addressing in the retrieval task is the modality gap between attribute queries and persons’ images."
"In summary, our main contributions can be listed as below..."
"We evaluate the unified CLEAR model on published benchmarks: PA100K, PETA, RAPv2, Market-1501, and UPAR datasets."