Główne pojęcia
사전 학습된 딥러닝 모델을 활용하여 별도의 미세 조정 없이도 신뢰할 수 있는 감정 특징을 추출하는 방법을 제안합니다.
Streszczenie
이 논문은 제6회 ABAW 대회에 참여한 HSEmotion 팀의 결과를 소개합니다. 얼굴 분석의 신뢰성을 높이기 위해 하류 작업을 위한 신경망 미세 조정 없이도 신뢰할 수 있는 감정 특징을 추출할 수 있는 사전 학습된 딥 모델의 가능성을 연구합니다. 특히 MobileViT, MobileFaceNet, EfficientNet, DDAMFN 아키텍처를 기반으로 한 여러 가벼운 모델을 소개하며, 이 모델들은 정적 사진에서 얼굴 표정, 정서가, 각성도를 인식하도록 다중 작업 시나리오에서 학습됩니다. 이러한 신경망은 프레임 수준의 특징을 추출하여 단순한 분류기(예: 선형 피드포워드 신경망)에 공급하여 정서 강도, 복합 표정, 행동 단위, 얼굴 표정 및 정서가/각성도를 예측합니다. 제6회 ABAW 대회의 5가지 과제에 대한 실험 결과는 기존의 비앙상블 기술에 비해 검증 세트의 품질 지표를 크게 향상시킬 수 있음을 보여줍니다.
Statystyki
얼굴 이미지 287,651장으로 구성된 AffectNet 공식 학습 세트
얼굴 이미지 4,000장으로 구성된 AffectNet 검증 세트
Aff-Wild2 데이터셋의 1,653,930장 얼굴 이미지 학습 세트와 376,332장 검증 세트
Aff-Wild2 데이터셋의 585,317장 레이블된 프레임 학습 세트와 280,532장 검증 세트
Aff-Wild2 데이터셋의 1,356,694장 레이블된 얼굴 프레임 학습 세트와 445,836장 검증 세트
Cytaty
"사전 학습된 딥 모델을 활용하여 별도의 미세 조정 없이도 신뢰할 수 있는 감정 특징을 추출하는 방법을 제안합니다."
"MobileViT, MobileFaceNet, EfficientNet, DDAMFN 아키텍처를 기반으로 한 여러 가벼운 모델을 소개하며, 이 모델들은 정적 사진에서 얼굴 표정, 정서가, 각성도를 인식하도록 다중 작업 시나리오에서 학습됩니다."
"이러한 신경망은 프레임 수준의 특징을 추출하여 단순한 분류기에 공급하여 정서 강도, 복합 표정, 행동 단위, 얼굴 표정 및 정서가/각성도를 예측합니다."