VoxHakka는 대만 타이완 하카어를 위한 고품질 다화자 음성 합성 시스템이다. 주요 특징은 다음과 같다:
6개 주요 하카어 방언 지원: VoxHakka는 Sixian, Hailu, Dapu, Raoping, Zhaoan, Nansixian 등 6개 하카어 방언의 음성을 합성할 수 있다.
윤리적으로 확보된 신뢰할 수 있는 데이터: 정부 교육 기관과 공공 재단의 온라인 자료를 활용하여 데이터를 수집하였으며, 정확성과 주석이 보장된다.
제로샷 합성 및 효율적 추론: YourTTS 기술을 활용하여 화자 임베딩 없이도 새로운 화자의 음성을 합성할 수 있으며, CPU 자원만으로도 효율적인 추론이 가능하다.
오픈 접근성: VoxHakka는 CC-BY 4.0 라이선스 하에 공개되어 누구나 자유롭게 활용, 수정, 공유할 수 있다.
주관적 청취 평가 결과, VoxHakka는 기존 공개 하카어 음성 합성 시스템에 비해 발음 정확성, 억양 정확성, 전반적인 자연스러움 면에서 크게 향상된 성능을 보였다. 이는 하카어 언어 기술 발전과 언어 보존 및 활성화 노력에 기여할 것으로 기대된다.
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Li-Wei Chen,... : arxiv.org 09-25-2024
https://arxiv.org/pdf/2409.01548.pdfDaha Derin Sorular