Core Concepts
自己教育学習を活用した顔認識のためのランドマークベースの手法による効果的な表現学習
Abstract
未ラベル化されたデータを使用して一般化された表現を学習する自己教育パイプラインが提案されている。
LAFSは、顔認識向けの新しいランドマークベースの自己教育学習フレームワークであり、ランドマークに基づく表現を最小限にし、少ないランドマークで顔認識に転送する。
ランドマークシャッフルとランドマーク座標摂動という2つの拡張が効果的であることが示されている。
Introduction:
既存のラベル付きデータセットではなく、実世界には大量の未ラベル化された顔画像が存在する。
LAFSは、特定の部位モデルと自己教育学習を組み合わせることで優れたローカリゼーション性能を示す。
Methodology:
DINO [6]を採用して顔認識事前トレーニングを開始し、全体的なビューと局所ビュー間のコントラスト学習により強力な特徴埋め込みを提供する。
ランドマークシャッフルおよびランドマーク座標摂動という2つの拡張が設計されており、効果的かつ堅牢である。
Experiments:
提案手法は多くの顔認識ベンチマークで最先端または近接した結果を達成しており、特に少数ショット評価では他手法よりも優れた性能を発揮している。
Stats
自己教育パイプラインは未ラベル化されたWebface260Mデータセットから1M枚の画像で事前トレーニングされています。
Quotes
"Without explicit label information, our pipeline, which comprises unlabeled(1-shot) pretraining followed by 1-shot fine-tuning, can deliver accurate face recognition performance."
"We propose a novel landmark-based self-supervised framework for face recognition that pertains entirely to facial parts."