本研究旨在提升庫德語文字轉語音(TTS)系統的性能。研究團隊利用 21 小時的高質量庫德語語料庫,訓練 WaveGlow 聲碼器,以取代先前使用英語預訓練模型的方法。
訓練過程中,研究團隊對 WaveGlow 模型進行了多項優化,包括改進韻律建模技術,提升合成語音的節奏、重音和語調等特性,使之更接近自然人類語音。
實驗結果顯示,基於母語語料庫訓練的 WaveGlow 模型在各類內容的平均主觀評分(MOS)達到 4.91,顯著優於先前使用英語預訓練模型的系統。這一成果不僅提升了庫德語 TTS 的性能,也為其他低資源語言的語音合成研究提供了可行的方法。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Abdulhady Ab... klo arxiv.org 09-24-2024
https://arxiv.org/pdf/2409.13734.pdfSyvällisempiä Kysymyksiä