本項目旨在解決文本到語音(TTS)合成系統在韻律方面與人類語音之間存在的差距,包括音高、持續時間和能量等特徵。通過提取和比較人類語音和TTS語音的韻律特徵,並開發算法來操縱TTS語音的韻律參數,使其更接近自然語音的韻律特徵,從而提高合成語音的自然性和表現力。
主要步驟包括:
通過這種方法,我們成功地提高了TTS生成語音的自然性和表現力,為TTS技術的進步做出了貢獻。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Podakanti Sa... alle arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.12176.pdfDomande più approfondite