本文提出了一種非同步語音匿名化方法,透過對說話者嵌入進行對抗擾動,在保留人類感知的同時,混淆機器對說話者屬性的識別。
本文提出了一種基於深度學習的語音匿名化系統,該系統採用端到端串流模型,能夠以低延遲實現語音匿名化,並在自然度、清晰度和隱私保護方面保持最先進的性能。
本文提出了一種名為 DDSP-QbE 的語音轉換方法,旨在匿名化老年人和病理性語音,同時保留其韻律和獨特的語音特徵,以用於遠程醫療監控等應用。
本研究提出了一種基於感知信息損失函數的新方法,用於提升語音匿名化過程中語音轉換的品質,無需複雜的模型架構,即可顯著改善語音的自然度、清晰度和韻律保留。
本論文描述了國立臺灣大學與南洋理工大學團隊參與語音隱私挑戰賽 2024 的系統設計,著重於改進現有基準模型,以在保護語者隱私的同時,盡可能保留語音的情感和內容資訊。