이 연구는 얼굴 표정 인식(FER) 문제를 해결하기 위한 두 단계 접근법을 제안한다.
첫 번째 단계인 공간 사전 학습 단계에서는 반자지도 학습 기술을 활용하여 레이블이 없는 얼굴 데이터에서 표정 범주의 의사 레이블을 생성함으로써 FER 데이터셋을 확장한다. 이와 동시에 균등 샘플링과 편향 제거 피드백 학습 전략을 도입하여 데이터셋의 범주 불균형 문제와 반자지도 학습의 잠재적 데이터 편향 문제를 해결한다.
두 번째 단계인 시간적 학습 단계에서는 정적 이미지에서 얻은 특징의 한계와 편향을 보완하기 위해 시간적 인코더를 도입한다. 이를 통해 인접 표정 이미지 특징 간의 시간적 관계를 학습하고 포착함으로써 동적 얼굴 표정 인식 및 분석 능력을 향상시킨다.
이 방법론은 ABAW 6차 대회에서 공식 검증 세트에서 우수한 결과를 달성하여 제안 방법의 효과성과 경쟁력을 입증했다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor