ConSinger 是一種基於一致性模型的歌聲合成方法,能夠以最少的步驟實現高效的高保真歌聲合成。
本文提出了一種新的歌聲合成方法 GOLF(GlOttal-flow LPC Filter),它利用可微分數字信號處理技術,通過模擬人類聲音的物理特性來合成歌聲,並在效率和性能上取得了顯著的成果。
本文提出了一種基於源濾波模型的新型歌聲合成系統SiFiSinger,該系統通過將聲學特徵解耦成代表音調的源激勵信號和代表頻譜包絡的梅爾倒譜,並結合可微分的重建損失,實現了比傳統方法更高的音調準確性和音頻質量。
本文提出了一種名為Period Singer的新型端到端歌聲合成模型,利用變分推論來建模週期性和非週期性成分,以產生自然的音波形。