本文提出了一種基於檢索增強方法的無監督異常聲音檢測與標註方法,利用預先訓練好的 CLAP 模型,無需額外訓練即可實現高精度的異常聲音檢測和與異常原因一致的文字標註。
本研究提出了一種基於源分離模型的表徵學習方法,用於在沒有異常聲音樣本的情況下,訓練異常聲音檢測系統,並證明了該方法相較於傳統的自編碼器和僅關注目標信號分離的源分離技術,能更有效地學習聲音表徵,並提升異常聲音檢測的效能。
本文提出了一種基於注意力機制和可分離卷積的低複雜度深度神經網絡,用於無監督異常聲音檢測,並在 DCASE 2020 挑戰賽數據集上驗證了其有效性。
本文提出了一種基於自監督學習和預訓練模型的新穎系統,通過利用音頻預訓練模型並採用低秩適應(LoRA)微調的方法,在DCASE 2023 Task 2數據集上取得了顯著的性能提升,達到了77.75%的評估集成績,較之前最佳模型提高了6.48%。