Core Concepts
顔画像の品質を評価するために、事前学習済みの顔認識モデルのパラメータの変化量を利用する新しい手法を提案する。
Abstract
本研究では、顔画像の品質を評価するための新しい手法「GraFIQs」を提案している。従来の顔画像品質評価(FIQA)手法は、教師データの品質ラベルを必要としたり、特殊な損失関数の設計や最適化が必要だったりするが、GraFIQsはそれらを必要としない。
GraFIQsでは、事前学習済みの顔認識モデルを利用する。まず、入力画像をモデルに通して、バッチノーマライゼーション統計量(BNS)を抽出する。次に、BNSの平均二乗誤差(MSE)を計算し、その誤差を逆伝播させることで、モデルパラメータの変化量(勾配の大きさ)を得る。この勾配の大きさの絶対値和を、その入力画像の品質スコアとして使う。
実験の結果、GraFIQsは教師データの品質ラベルを必要とせず、特殊な設計も必要としないにもかかわらず、最新の手法と同等以上の性能を示すことができた。特に、大きな年齢差や姿勢変化のある顔画像の品質評価において優れた結果が得られた。このように、事前学習済みモデルの勾配情報を利用する新しい発想に基づく手法であるGraFIQsは、顔画像品質評価の新しいアプローチを示している。
Stats
顔認識モデルのバッチノーマライゼーション統計量(BNS)の平均二乗誤差(MSE)は、入力画像と学習データ分布の差異を表す。
逆伝播によって得られる勾配の大きさの絶対値和は、入力画像の品質を表す指標となる。
Quotes
"顔画像の品質を評価するために、事前学習済みの顔認識モデルのパラメータの変化量を利用する新しい手法を提案する。"
"GraFIQsは教師データの品質ラベルを必要とせず、特殊な設計も必要としないにもかかわらず、最新の手法と同等以上の性能を示すことができた。"