核心概念
合成データを用いて顔認識モデルを効率的に学習し、実データに匹敵する性能を達成することが本論文の主要な目的である。
要約
本論文は、合成データを用いた顔認識モデルの開発に関する「合成データによる顔認識(SDFR)」コンペティションの概要を説明している。
コンペティションの概要は以下の通り:
2つのタスクから構成される
タスク1: 固定のバックボーンネットワークを使用し、合成データの量を100万枚以下に制限
タスク2: バックボーンネットワークや合成データの量に制限なし
参加チームは新規に合成データを生成したり、既存の合成データセットを使用したりして、顔認識モデルを学習
学習したモデルは7つの評価データセットで性能評価
最終的な順位付けはボルダカウントで決定
参加チームの提案手法は以下の通り:
BioLab: IDiff-Faceとdigifaceの合成データを使用し、データ拡張を強化
IGD-IDiff-Face: IDiff-Faceの2つのサブセットを組み合わせて使用
APhi: IDiff-Faceの合成データを使用し、MagFaceロス関数を採用
BOVIFOCR-UFPR: IDiff-Faceの合成データを使用し、ポーズ変換データ拡張を適用
BiDA-PRA: IDiff-Faceの合成データを使用し、人種/性別バイアス低減のためのデータクリーニングを実施
最終的な評価の結果、合成データを用いた顔認識モデルは実データを用いたモデルと比べて性能が劣るものの、提案手法によって大幅な性能向上が達成された。今後の課題として、合成データの規模拡大や、より高品質な合成データの生成などが挙げられる。
統計
実データを用いたベースラインモデルのLFW精度は99.8%超
合成データを用いたベースラインモデルのLFW精度は85.6-90.6%
提案手法のBioLabモデル(タスク2)のLFW精度は98.3%