核心概念
本研究は、テスト時のデータを活用して顔提示攻撃検知モデルの一般化性能を向上させる新しい手法を提案する。具体的には、未知のテスト時データをソースドメインの特徴空間に射影する手法と、多様なスタイルシフトを合成する手法を開発し、モデルの一般化性能を大幅に向上させている。
要約
本論文は、顔提示攻撃検知(Face Anti-Spoofing, FAS)における一般化性能の向上を目的としている。従来のドメイン一般化(DG)手法は、訓練時にドメイン不変な特徴を学習することに焦点を当ててきたが、訓練データと大きく異なる未知のデータに対する一般化性能は依然として課題となっていた。
本研究では、テスト時のデータを活用して一般化性能を向上させる新しい手法「テスト時ドメイン一般化(TTDG)」を提案する。具体的には以下の2つの手法を開発している:
テスト時スタイル射影(TTSP): 未知のテスト時データをソースドメインの特徴空間に射影する手法。ソースドメインの特徴統計量(平均、分散)を表すスタイルベースを学習し、未知データをこれらのベースの重み付き和として射影する。
多様なスタイルシフトの合成(DSSS): スタイルベースを学習する際に、ベース間の直交性と入力特徴との整合性を保つ2つの損失関数を導入し、多様なスタイルシフトを合成する。
これらの手法により、テスト時のデータを活用してモデルの一般化性能を大幅に向上させることができる。実験では、従来手法を大きく上回る性能を示している。
統計
顔提示攻撃検知タスクにおいて、従来手法と比べて5%~6%のHTER(誤検知率)の改善を達成した。
訓練データが極端に少ない場合でも、提案手法は大幅な性能向上を示した。
引用
"Face Anti-Spoofing (FAS) is pivotal in safeguarding fa-cial recognition systems against presentation attacks."
"Our insight is that testing data can serve as a valuable resource to enhance the generalizability beyond mere evaluation for DG FAS."