Core Concepts
本論文は、擬似ラベルの修正とモダリティレベルのアラインメントを通じて、
アイデンティティ識別性と
モダリティ不変性を備えた特徴表現を学習することを提案する。
Abstract
本論文は、無監督可視赤外線人物再同定(UVI-ReID)の課題に取り組んでいる。
従来の手法では、クラスタリングによる擬似ラベルの生成と、
モダリティ間の特徴マッチングを行っていたが、
- 擬似ラベルにノイズが含まれる可能性、
- モダリティ間の特徴アラインメントが不十分
といった問題点があった。
本論文では、理論的な分析に基づき、
2つの新しい手法を提案している。
- 擬似ラベル修正(PLC)
- ネットワークの記憶効果を利用して、
ノイズの含まれる擬似ラベルの確率を推定
- 推定確率に基づいて、対照学習の損失関数に知覚項を導入
- これにより、ノイズの影響を軽減し、
より識別性の高い特徴を学習できる
- モダリティレベルアラインメント(MLA)
- 双方向の特徴変換モジュールを導入し、
モダリティ間の対応付けられた特徴を生成
- 生成された特徴に基づいて、
モダリティ間の特徴アラインメントを行う
- これにより、モダリティ間のギャップを削減できる
実験結果から、提案手法が既存の無監督手法を
大きく上回る性能を示すことが確認された。
Stats
可視特徴ZVとZIの間のラベル関数の差は、
min{EDV[|fI-fV|], EDI[|fI-fV|]}で表される。
可視特徴ZVとモダリティ間の特徴ギャップは、
2d ˜H(bDV, bDI)で表される。
Quotes
"Can learning modality-invariant identity-discriminative features be guaranteed by intra-modal clustering and inter-modal matching? If not, under what conditions is it possible?"
"We give a negative answer to the first question based on the above analysis."