核心概念
본 연구는 해상도가 다양한 이미지에서도 얼굴 표정 인식 모델의 성능을 유지할 수 있는 실용적인 방법인 동적 해상도 가이드(DRGFER) 프레임워크를 제안한다.
摘要
본 논문은 얼굴 표정 인식(FER)에 대한 실용적인 방법인 동적 해상도 가이드(DRGFER) 프레임워크를 제안한다. DRGFER는 두 가지 주요 구성 요소로 이루어져 있다:
- 해상도 인식 네트워크(RRN): 입력 이미지의 해상도를 판단하고 이진 벡터를 출력한다.
- 다중 해상도 적응 얼굴 표정 인식 네트워크(MRAFER): RRN의 출력 벡터를 기반으로 적절한 FER 네트워크를 선택하여 얼굴 표정을 인식한다.
실험 결과, DRGFER는 다양한 해상도의 이미지에서 최적의 모델 성능을 유지하며, 기존 방법들보다 우수한 성능을 보였다. 이는 해상도 변화와 얼굴 표정에 강건한 솔루션을 제공한다.
統計資料
해상도가 낮아질수록 기존 모델의 정확도가 크게 감소한다.
DRGFER는 각 해상도에서 최고의 정확도를 유지한다.
DRGFER의 평균 정확도는 RAF-DB 데이터셋에서 84.41%, FERPlus 데이터셋에서 80.72%로 가장 높다.
引述
"실제 군중 장면에서는 저해상도 이미지가 널리 존재하며, 이는 전통적인 방법으로 추출된 특징 정보의 손실로 인해 식별 능력이 감소하는 주요 문제이다."
"기존 연구는 주로 특정 해상도에서의 모델 정확도 향상에 초점을 맞추었으며, 다양한 해상도에 적응할 수 있는 모델의 개발에는 관심이 부족했다."