복잡계 네트워크에서 죄수의 딜레마 게임에 대한 적대적 공격을 통해 링크 가중치를 미세하게 조정함으로써 협력을 효과적으로 증진하거나 억제할 수 있다.
DeSparsify 공격은 비전 트랜스포머 모델의 효율성을 위해 사용되는 토큰 희소화 메커니즘의 취약점을 악용하여 시스템 리소스를 고갈시키는 새로운 적대적 공격 기법입니다.
본 논문에서는 시각적 추론 능력을 갖춘 비전-언어 모델(VLM)을 대상으로, 이미지의 특정 객체를 다른 객체로 교체하여 모델을 속이는 새로운 표적 지향적 적대적 공격 기법을 제안합니다.
본 논문에서는 텍스트의 불연속적인 특성으로 인해 발생하는 기존 그래디언트 기반 적대적 프롬프트 생성 공격의 한계를 지적하고, 이미지 분류 모델 공격에 사용되는 전이 기반 공격에서 영감을 얻은 새로운 접근 방식을 제시하여 공격 성공률을 크게 향상시켰습니다.
이 논문은 지난 10년간 이미지 인식 모델을 대상으로 한 적대적 공격 기술의 발전 과정을 포괄적으로 검토하고, 전통적인 공격 방식과 최신 대규모 비전-언어 모델(LVLM) 공격 방식을 비교 분석하여 미래 연구 방향을 제시합니다.
본 논문에서는 생성형 대규모 언어 모델(LLM)의 취약점을 악용하여 유해한 콘텐츠를 생성하도록 유도하는 CoT(Chain of Thought) 기반 적대적 공격 기법을 제안하고, 이를 통해 LLM의 안전성 및 견고성을 평가합니다.
공개된 SAM (Segment Anything Model) 정보만을 활용하여 SAM 기반 다운스트림 모델에 대한 효과적인 적대적 공격 (UMI-GRAT)을 수행할 수 있으며, 이는 오픈소스 기반 모델의 취약성을 보여준다.
본 논문에서는 가시-적외선 보행자 재식별(VI-ReID) 모델을 대상으로 하는 새로운 물리적 적대적 공격 방법인 Edge-Attack을 제안하며, 이는 기존 VI-ReID 모델이 얕은 수준의 엣지 특징에 의존하는 취약점을 이용하여 적대적 패치를 생성하고, 실제 환경에서도 공격을 가능하게 합니다.
정규화된 이완 기법을 사용한 새로운 적대적 공격 방식은 기존 방법보다 효율적이고 효과적으로 대규모 언어 모델에서 유해한 동작을 유도하는 방법을 제시한다.
GADT는 데이터 증강(DA) 파라미터를 적대적 공격 목표에 맞게 최적화하여, 기존 전이 공격 방법의 성능을 향상시키는 새로운 공격 기법입니다.