Centrala begrepp
本研究では、既存の顔画像データセットでは不足している極端な姿勢の顔画像を大量に含む高品質なデータセット EFHQ を提案する。EFHQ は顔関連のさまざまなタスク(2D/3D 画像生成、テキストから画像生成、顔リエンアクトメント、顔認証)の性能向上に役立つ。
Sammanfattning
本研究では、VFHQ と CelebV-HQ の2つの公開データセットから、高品質な極端な姿勢の顔画像を大量に抽出・収集し、EFHQ データセットを構築した。EFHQ には最大45万枚の高品質な極端な姿勢の顔画像が含まれる。
EFHQ の特徴は以下の通り:
- 大規模(最大45万枚)
- 高品質
- 様々な姿勢(正面から極端な側面まで)
- 同一人物の複数画像
- 個人識別情報付き
EFHQ は既存の顔画像データセットを補完し、以下のタスクの性能向上に役立つ:
- 2D/3D 画像生成
- テキストから画像生成
- 顔リエンアクトメント
- 顔認証
実験の結果、EFHQ を使うことで、極端な姿勢の顔に対する生成や認識の性能が大幅に向上することが示された。また、EFHQ を使った顔認証のベンチマークを提案し、従来手法の課題を明らかにした。
Statistik
極端な姿勢の顔画像は、正面の顔画像に比べて、既存の顔認識モデルの性能が5-37%低下する。
極端な姿勢の顔画像を含むデータセットを使うことで、2D/3D 画像生成モデルの性能が大幅に向上する。
Citat
"既存の顔画像データセットは正面の画像が多く、極端な姿勢の画像が不足しているため、深層学習モデルの性能が低下する問題がある。"
"本研究で提案するEFHQデータセットは、大規模で高品質な極端な姿勢の顔画像を含み、様々な顔関連タスクの性能向上に役立つ。"