本文提出了一種新的損失函數,用於在相位重建(PR)和語音增強(SE)任務中生成一致的相位譜。與現有的方法不同,該損失函數不會強制模型直接估計單一的相位解決方案,而是要求生成與幅度譜一致的相位譜。
在PR任務中,實驗結果表明,使用所提出的損失函數可以生成高質量的相位譜,優於直接估計原始相位的方法。
在SE任務中,無論是否使用MetricGAN損失,在VB-DMD和WSJ0-CHiME3數據集上,使用所提出的一致性損失函數都能取得顯著的性能提升,尤其是在低信噪比情況下。這表明該損失函數可以有效地指導深度模型生成一致的相位譜,從而提高最終的語音質量。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Pin-Jui Ku, ... في arxiv.org 09-25-2024
https://arxiv.org/pdf/2409.16282.pdfاستفسارات أعمق