이 논문은 제6회 ABAW 대회에 참여한 HSEmotion 팀의 결과를 소개합니다. 얼굴 분석의 신뢰성을 높이기 위해 하류 작업을 위한 신경망 미세 조정 없이도 신뢰할 수 있는 감정 특징을 추출할 수 있는 사전 학습된 딥 모델의 가능성을 연구합니다. 특히 MobileViT, MobileFaceNet, EfficientNet, DDAMFN 아키텍처를 기반으로 한 여러 가벼운 모델을 소개하며, 이 모델들은 정적 사진에서 얼굴 표정, 정서가, 각성도를 인식하도록 다중 작업 시나리오에서 학습됩니다. 이러한 신경망은 프레임 수준의 특징을 추출하여 단순한 분류기(예: 선형 피드포워드 신경망)에 공급하여 정서 강도, 복합 표정, 행동 단위, 얼굴 표정 및 정서가/각성도를 예측합니다. 제6회 ABAW 대회의 5가지 과제에 대한 실험 결과는 기존의 비앙상블 기술에 비해 검증 세트의 품질 지표를 크게 향상시킬 수 있음을 보여줍니다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Andrey V. Sa... klo arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11590.pdfSyvällisempiä Kysymyksiä