이 연구는 비전-언어 사전학습 모델(VLP)의 취약점을 탐색하고 공격의 전이성을 향상시키는 방법을 제안한다.
먼저, 기존 연구에서 제안된 Set-level guidance attack(SGA) 방법이 온라인 적대적 예시(AE) 주변의 다양성에 초점을 맞춤으로써 과적합의 위험이 있음을 분석한다. 이를 해결하기 위해 본 연구에서는 적대적 궤적의 교차 영역을 활용하여 AE의 다양성을 확장하는 방법을 제안한다.
또한 텍스트 모달리티에서도 마지막 교차 영역으로부터 벗어나도록 AE를 생성함으로써 대리 모델에 대한 과적합을 완화한다.
실험 결과, 제안 방법은 다양한 VLP 모델과 비전-언어 과제(이미지-텍스트 검색, 비주얼 그라운딩, 이미지 캡셔닝)에서 공격의 전이성을 크게 향상시킨다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Sensen Gao,X... um arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12445.pdfTiefere Fragen