Belangrijkste concepten
본 연구에서는 가시적이고 의미적이며 샘플별 호환 가능한 트리거(VSSC 트리거)를 제안하여, 효과적이고 은밀하며 강건한 백도어 공격을 달성하였다.
Samenvatting
본 연구는 다음과 같은 내용을 다룹니다:
가시적이고 의미적이며 샘플별 호환 가능한 VSSC 트리거를 정의하여, 효과성, 은밀성, 강건성을 동시에 달성할 수 있는 새로운 백도어 공격 트리거를 제안하였습니다.
VSSC 트리거를 자동으로 구현하기 위한 파이프라인을 제안하였습니다. 이 파이프라인은 대규모 언어 모델의 강력한 기능을 활용하여 적절한 트리거를 선택하고, 생성 모델을 사용하여 트리거를 이미지에 자연스럽게 삽입하며, 비전-언어 모델을 통해 삽입 품질을 평가합니다.
이미지 분류, 객체 탐지, 얼굴 인증 등 다양한 작업에 대한 실험 결과를 통해 VSSC 트리거의 우수한 성능을 입증하였습니다. VSSC 트리거는 시각적 왜곡에 대한 강건성을 보여줄 뿐만 아니라 물리적 시나리오에서의 실용성도 입증하였습니다.
Statistieken
백도어 공격의 성공률(ASR)이 최대 99.03%에 달했습니다.
깨끗한 정확도(C-Acc)는 최대 92.86%로 유지되었습니다.
원래 클래스로 분류되는 비율(R-Acc)은 최대 2.38%에 불과했습니다.
Citaten
"VSSC 트리거는 시각적 왜곡에 대한 강건성을 보여줄 뿐만 아니라 물리적 시나리오에서의 실용성도 입증하였습니다."
"VSSC 트리거는 효과성, 은밀성, 강건성을 동시에 달성할 수 있는 새로운 백도어 공격 트리거를 제안하였습니다."