Core Concepts
생성 확산 모델을 활용하여 도메인 간 및 공격 유형 간 고품질 가짜 얼굴 이미지를 생성함으로써, 얼굴 위조 탐지 성능을 향상시킨다.
Abstract
이 논문은 얼굴 위조 탐지(FAS) 문제에 대한 새로운 접근법을 제안한다. 기존 FAS 시스템은 도메인 간 이동으로 인한 성능 저하 문제에 직면했는데, 이를 해결하기 위해 저자들은 도메인 이동을 이미지 품질과 이미지 스타일의 두 가지 요인으로 구분하였다.
이미지 품질은 이미지 열화, 흐림, 저해상도 등의 요인으로 정의되며, 이미지 스타일은 공격 유형에 따른 색상 및 질감 차이로 특징지어진다. 저자들은 이 두 가지 요인이 네트워크에 잘못된 선행 정보를 제공하여 정확한 위조 단서 학습을 방해한다고 분석했다.
이를 해결하기 위해 저자들은 DiffFAS 프레임워크를 제안했다. DiffFAS는 이미지 품질을 사전 정보로 활용하여 품질 변화에 대응하고, 확산 기반 고품질 크로스 도메인 및 크로스 공격 유형 생성을 통해 스타일 변화에 대응한다. 또한 쉽게 수집할 수 있는 실제 얼굴 이미지를 고품질 공격 이미지로 변환하여 레이블된 데이터 부족 문제를 해결한다.
실험 결과, DiffFAS는 다양한 벤치마크 데이터셋에서 최신 기술 수준을 능가하는 성능을 보였다. 특히 제한된 소스 도메인 환경과 새로운 공격 유형이 포함된 데이터셋에서 두드러진 성능 향상을 보였다.
Stats
이미지 품질 점수(BRISQUE)가 낮을수록 이미지 품질이 높다.
상대적 품질 점수가 높을수록 분류 모델이 해당 이미지에 더 큰 가중치를 두게 된다.
Quotes
"Face anti-spoofing (FAS) plays a vital role in preventing face recognition (FR) systems from presentation attacks."
"Existing domain generalization methods address domain shifts by incorporating human prior information, such as domain-specific details and ID information, which should be considered disturbances and need to be disregarded."
"Diffusion models have demonstrated exceptional performance in the realm of high-quality image generation. However, the denoising process, as discussed in [31], tends to suppress high-frequency information, encompassing vital texture cues crucial for FAS tasks."