이 논문은 비전 트랜스포머(ViT) 모델의 취약성을 공격하는 새로운 방법을 제안한다. ViT 모델은 최근 다양한 컴퓨터 비전 작업에서 뛰어난 성능을 보이고 있지만, 적대적 공격에 취약한 것으로 알려져 있다.
기존의 적대적 공격 방법들은 분류 레이블에 의존하여 gradient를 계산하기 때문에 다른 모델로의 전이성이 낮다. 이 논문에서는 레이블 정보 없이도 효과적으로 ViT 모델을 공격할 수 있는 새로운 방법을 제안한다.
이 방법의 핵심 아이디어는 ViT 모델에서 관찰되는 특징 붕괴 현상을 활용하는 것이다. ViT 모델의 핵심 어텐션 메커니즘은 저주파 성분에 과도하게 의존하여 중간-후반 레이어의 특징이 점점 유사해지고 결국 붕괴된다.
이 논문에서는 특징 다양성 공격기를 제안하여 이 과정을 자연스럽게 가속화함으로써 뛰어난 성능과 전이성을 달성한다. 실험 결과, 제안 방법은 다양한 ViT 변형 모델뿐만 아니라 CNN, MLP 모델에서도 우수한 전이성을 보였다. 또한 레이블 정보 없이도 다른 작업(객체 탐지, 의미 분할 등)에 효과적으로 적용될 수 있음을 확인하였다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések