자기지도학습 모델이 적절한 지식 전이를 통해 목표 언어에 적응할 수 있으며, 모국어 화자 수준의 성능을 달성할 수 있음을 보여줌. 또한 방언이 다국어 음성 감정 인식에 미치는 영향을 입증하며, 인간과 모델의 감정 인식 능력에 차이가 있음을 확인함.
HuBERT 기반 성별 증강 다중 스케일 의사 레이블 적응형 전이 학습 기법을 통해 음성 감정 인식 성능을 크게 향상시킬 수 있다.
본 논문은 음성 향상 모듈과 음성 감정 인식 모듈을 효과적으로 결합하여 불확실한 잡음 환경에서의 강인한 음성 감정 인식 성능을 달성하는 방법을 제안한다.
음성 데이터의 음향 및 텍스트 기반 특징을 융합하여 감정 인식 성능을 향상시킬 수 있다.
본 연구는 다양한 음성 속성을 정밀하게 제어하여 음성 감정 모델링을 향상시키는 새로운 통합 음성 감정 인식 프레임워크 MSAC-SERNet을 제안한다.
본 연구는 DARTS를 활용하여 CNN과 순차 신경망 구조를 최적화하여 음성 감정 인식 성능을 향상시킨다.
EMO-SUPERB는 음성 감정 인식 분야의 재현성 향상, 데이터 누출 해결, 미사용 감정 설명 활용 등 주요 과제를 해결하기 위해 개발되었다.
실제 환경에서 녹음된 음성 메시지를 사용하여 음성 감정 인식 모델을 개발하고 비교하는 연구