核心概念
제안된 LANMSFF 모델은 경량 완전 합성곱 신경망 구조와 두 개의 새로운 모듈인 MassAtt와 PWFS를 활용하여 높은 계산 복잡성과 다양한 각도의 얼굴 자세 문제를 해결한다.
摘要
이 논문은 얼굴 표정 인식(FER) 문제에 대한 새로운 접근 방식을 제안한다. 기존 CNN 기반 방법들은 높은 계산 복잡성과 실제 환경에서의 다양한 각도 문제에 직면했다. 이를 해결하기 위해 LANMSFF라는 경량 주의 집중 기반 완전 합성곱 신경망을 제안한다.
LANMSFF의 주요 구성은 다음과 같다:
- 경량 완전 합성곱 신경망 구조: 정확도와 파라미터 수의 균형을 맞추며 다양한 각도 자세에 대응한다.
- MassAtt 모듈: 채널 및 공간 주의 집중 맵을 동시에 생성하여 중요 특징은 강조하고 관련 없는 특징은 억제한다.
- PWFS 모듈: 다중 스케일 특징 융합 전에 약한 특징을 제거하여 효율성을 높인다.
실험 결과, LANMSFF는 KDEF, FER-2013, FERPlus 데이터셋에서 SOTA 수준의 성능을 보이며 다양한 각도 자세에 대한 강건성을 입증했다. 또한 파라미터 수가 최적화되어 실제 응용에 적합하다.
统计
KDEF 데이터셋에서 전체 정확도는 90.77%이며, 각도별 정확도는 -90°: 89.44%, -45°: 91.18%, 0°: 92.04%, 45°: 91.00%, 90°: 90.17%로 나타났다.
FER-2013 데이터셋에서 전체 정확도는 70.44%이며, 30° 이상 각도에서는 69.15%, 45° 이상 각도에서는 66.82%의 정확도를 보였다.
FERPlus 데이터셋에서 전체 정확도는 86.96%이며, 30° 이상 각도에서는 86.92%, 45° 이상 각도에서는 84.68%의 정확도를 보였다.
引用
"MassAtt 모듈은 채널 및 공간 주의 집중 맵을 동시에 생성하여 중요 특징은 강조하고 관련 없는 특징은 억제한다."
"PWFS 모듈은 다중 스케일 특징 융합 전에 약한 특징을 제거하여 효율성을 높인다."