核心概念
提出一個名為CIAI的類別獨立對抗性意圖檢測網絡,能夠檢測有意圖的對抗性攻擊和無意圖的噪音,並區分它們。
摘要
本文提出了一個名為CIAI的類別獨立對抗性意圖檢測網絡。CIAI建立在修改後的視覺變換器上,並包含檢測層。CIAI使用一種新的損失函數,結合最大平均差異和中心損失,以檢測有意圖的對抗性攻擊和無意圖的噪音,而不考慮圖像類別。CIAI以多步驟的方式進行訓練。
實驗結果表明,CIAI能夠檢測有意圖的對抗性攻擊(如FGSM、PGD和DeepFool)和無意圖的噪音(如高斯噪音和椒鹽噪音)。CIAI在CelebA、CelebA-HQ、LFW、AgeDB和CIFAR-10數據集上表現出色。此外,注意力圖和tSNE圖顯示CIAI能夠關注區分原始圖像和修改圖像的關鍵特徵。
統計資料
原始圖像的性別預測準確率為99.58%。
使用FGSM攻擊後,性別預測準確率下降到4.90%。
使用PGD攻擊後,性別預測準確率下降到0.42%。
加入高斯噪音後,性別預測準確率為97.80%。
加入椒鹽噪音後,性別預測準確率為98.12%。
引述
"CIAI不僅能夠區分原始圖像和修改圖像,還能夠區分有意圖的(對抗性)噪音和無意圖的噪音,這兩種噪音都會影響模型的性能。"
"當使用Lp範數攻擊作為已知噪音時,基於類似公式的未知噪音也能以幾乎相同的準確度被檢測到。"
"我們的發現表明,即使分類準確度沒有受到無意圖噪音的顯著影響,CIAI仍然能夠保持強大的檢測能力。"