이 논문은 FER-YOLO-Mamba 모델을 제안한다. 이 모델은 YOLO 및 Mamba 기술의 장점을 결합하여 효율적인 얼굴 표정 이미지 탐지 및 분류를 달성한다.
주요 내용은 다음과 같다:
FER-YOLO-Mamba 모델은 상태 공간 모델(SSM)을 기반으로 한 시각적 백본 네트워크를 혁신적으로 개발했다. 이는 얼굴 표정 탐지 및 분류 분야에 SSM 기반 아키텍처를 통합한 최초의 시도이다.
FER-YOLO-VSS 이중 분기 구조를 설계했다. 이 구조는 원래의 국부적 상세 정보와 OSS가 제공하는 전역적 상황 정보를 통합할 뿐만 아니라 다층 퍼셉트론을 사용한 주의 메커니즘을 포함한다. 이 주의 메커니즘은 중요한 정보 영역을 선택적으로 증폭하고 관련성이 낮거나 부차적인 영역의 영향을 억제하여 FER 작업의 식별 능력과 정확성을 크게 향상시킨다.
RAF-DB와 SFEW 두 개의 기준 데이터셋에서 실험을 수행하여 FER-YOLO-Mamba 모델의 효과를 검증했다. 실험 결과, 다른 방법들에 비해 더 나은 성능을 달성했다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Hui Ma,Sen L... at arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.01828.pdfDeeper Inquiries