本研究主要包括以下內容:
提出一種利用語音合成模型和對抗性樣本生成技術的半自動化威脅模型,以攻擊D-CAPTCHA系統。該模型假設攻擊者能夠理解並執行系統提出的挑戰。
引入對抗性訓練作為一種緩解方法,以提高D-CAPTCHA系統的健壯性。通過使用投影梯度下降(PGD)對深度偽造檢測器和任務分類器進行對抗性訓練,可以顯著降低可轉移對抗性樣本的成功率。
對不同的語音轉換模型(kNN-VC、Urhythmic、TriAAN)、深度偽造檢測器(SpecRNet、RawNet2、RawNet3)和任務分類器(ResNet、RawNet3)進行了廣泛的實驗評估。
分析了特徵提取技術對不易察覺的對抗性樣本的影響,這有助於在設計基於語音的深度偽造檢測系統時限制對抗性的可轉移性。
總的來說,本研究提出了一種更加健壯的D-CAPTCHA++系統,可以有效地抵禦基於可轉移的不易察覺對抗性攻擊。
翻譯成其他語言
從原文內容
arxiv.org
深入探究