음성 변환 기술인 VoiceGrad은 Langevin dynamics 및 reverse diffusion 개념을 활용하여 비병렬 다대다 음성 변환을 가능하게 합니다.
DurFlex-EVC는 감정 음성 변환을 위한 새로운 모델로, 병렬 생성과 함께 유연한 지속 시간을 지원합니다.
고품질 음성 변환을 위한 Prosody-aware VITS 제안