核心概念
本文提出了一種針對視覺語言模型的新型目標對抗性攻擊方法「替換後擾動法」(Replace-then-Perturb),以及一種基於對比學習的對抗性損失函數「對比性對抗」(Contrastive-Adv),旨在生成更有效的對抗性範例,以欺騙視覺語言模型,使其在保留圖像整體完整性的同時,針對特定目標物體產生預期的錯誤輸出。
標題:基於視覺推理的視覺語言模型目標對抗性攻擊:替換後擾動法
作者:Jonggyu Jang、Hyeonsu Lyu、Jungyeon Koh、Hyun Jong Yang
本研究旨在解決現有針對視覺語言模型 (VLM) 的目標對抗性攻擊方法缺乏視覺推理能力的問題,提出一個能夠在改變目標物件的同時,維持圖像整體完整性並產生自然輸出結果的新方法。