核心概念
本稿では、大規模な顔認識システムにおける、新しい顔アイデンティティを継続的に学習するという課題に対処するため、スケーラブルかつリソース効率の高い継続学習フレームワーク「CLFace」を提案する。
要約
生涯顔認識のためのスケーラブルでリソース効率の高い継続学習フレームワーク:CLFace
書誌情報: Hasan, M. M., Sami, S. M., & Nasrabadi, N. (2024). CLFace: A Scalable and Resource-Efficient Continual Learning Framework for Lifelong Face Recognition. arXiv preprint arXiv:2411.13886.
研究目的: 本研究は、実世界の顔認識 (FR) アプリケーションにおいて、継続的なデータストリームから新しい顔アイデンティティを学習できる、スケーラブルでリソース効率の高い継続学習フレームワークを開発することを目的とする。
手法: 本稿では、既存の継続学習アルゴリズムの限界に対処するため、分類フリーアーキテクチャを採用した新しい継続学習フレームワーク「CLFace」を提案する。CLFaceは、マルチスケール特徴蒸留 (MSFD) 損失、ジオメトリ保存知識蒸留 (GPKD) 損失、および対照的知識蒸留 (CKD) 損失を組み合わせた新しい目的関数を採用し、過去の知識を保持しながら新しいアイデンティティを学習する。
主な結果: 複数のベンチマークFRデータセットを用いた実験の結果、CLFaceは、ドメイン内およびドメイン外のデータセットの両方において、未知のアイデンティティに対して、ベースラインアプローチや最先端の手法を上回る性能を示すことが実証された。
結論: CLFaceは、生涯顔認識のための有望なフレームワークを提供し、大規模なバイオメトリックシステムにおける、スケーラビリティ、リソース効率、および未知のアイデンティティに対するロバスト性に関する重要な課題に対処する。
意義: 本研究は、継続的な学習が必須である実世界のFRアプリケーション、特にリソースが限られているかプライバシーの懸念がある場合に、大きく貢献するものである。
限界と今後の研究: 今後の研究では、顔属性の変化への適応、低品質画像の処理、アイリスや掌紋認識などの他のバイオメトリックタスクへのアプローチの拡張などに取り組む必要がある。
統計
CLFaceは、CRL [43] と比較して、10ステップ学習で0.04%、0.05%、0.10%、5ステップ学習で0.04%、0.05%、0.10%のVA改善を示した。
CRL [43] と比較して、CLFaceは、10ステップ学習で0.03%、0.17%、0.09%、0.14%、0.22%、5ステップ学習で0.0%、0.11%、0.02%、0.07%、0.35%のVA改善を示した。
ベースデータが75%の場合、25%の場合と比較して、これらのデータセット全体でパフォーマンスが向上した。
インクリメンタルデータがトレーニングセットの90%を占める場合(1行目)、CALFW、CFPFP、CPLFW、IJB-C、TinyFaceでそれぞれVA(%)で0.25%、0.42%、0.51%、TAR@FAR = 0.1%で0.26%、Rank-1で1.31%の改善が見られた。
ID損失(ID + GPKD)を伴う最高のパフォーマンスの目的と比較して、私たちの目的、MFSD + GPKD + CKDは、AGEDBで0.53%、CALFWで0.14%の改善を示したが、CFPFPで1.06%、CPLFWで0.11%の低下も示した。