음성 기반 정신 건강 상태 탐지를 위해 다양한 사전 학습 모델의 잠재력을 탐구하고, 모델 구조와 하이퍼파라미터 설정이 성능에 미치는 영향을 분석하였다.
본 연구는 성전환자의 음성 전환 과정을 평가하기 위한 연속적인 음성 여성성 비율(Voice Femininity Percentage, VFP) 예측 시스템을 제안한다.
본 연구는 소라니 쿠르드어 하위 방언을 정확하게 분류하기 위해 심층 학습 모델을 개발하고자 합니다.
ASR 기반 Wav2Vec2 모델을 활용하여 두경부암 환자의 음성 품질을 효과적으로 평가할 수 있다.
자기지도학습 모델이 마비말장애 분류, 단어 인식, 지능성 분류 등의 과제에서 기존 음향 특징 기반 모델보다 우수한 성능을 보였다.