이 논문은 얼굴 이미지 품질 평가(FIQA) 분야에서 최신 기술 수준을 보여주는 방법을 제안한다. 기존 FIQA 방법 중 샘플 상대 분류 가능성을 의사 레이블로 사용하는 방식은 클래스 내 분산이 낮은 경우 실제 품질과 무관한 의사 레이블을 생성할 수 있다는 문제가 있다.
이를 해결하기 위해 저자들은 두 가지 핵심 기여를 제안한다:
클래스 내 분산 가이드: 클래스 내 분산이 낮은 경우 해당 클래스의 가중치를 낮추어 FIQA 모델 학습 시 부정확한 의사 레이블의 영향을 줄이는 방법을 제안한다. 이를 위해 지수 가중 평균을 활용하여 효율적으로 클래스 내 분산을 추정한다.
데이터 증강을 통한 FIQA 성능 향상: 다양한 품질의 얼굴 이미지를 생성하기 위해 온더플라이 데이터 증강 기법을 적용한다. 이때 증강된 이미지는 FIQA 모델 학습에만 활용하고 얼굴 인식 모델 학습에는 사용하지 않아 성능 저하를 방지한다.
제안 방법인 IG-FIQA는 다양한 벤치마크 데이터셋에서 기존 최신 기술 대비 우수한 성능을 보였다. 특히 다양한 품질의 이미지가 혼합된 데이터셋에서 두드러진 성능 향상을 보였다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Minsoo Kim,G... alle arxiv.org 03-14-2024
https://arxiv.org/pdf/2403.08256.pdfDomande più approfondite