본 연구는 AI 생성 이미지에 대한 워터마크 기반 탐지 시스템의 취약성을 분석하고 새로운 전이 공격 기법을 제안한다.
산업계에서 AI 생성 이미지 탐지를 위해 워터마크 기술이 널리 사용되고 있다. 하지만 워터마크 기반 탐지 시스템의 no-box 환경에서의 강건성은 충분히 이해되지 않았다.
본 연구에서는 no-box 환경에서 워터마크 기반 탐지 시스템을 우회하기 위한 새로운 전이 공격 기법을 제안한다. 제안하는 공격은 다수의 대리 워터마크 모델을 활용하여 목표 워터마크 모델을 효과적으로 우회할 수 있다.
제안하는 공격은 대리 워터마크 모델들의 출력을 활용하여 목표 워터마크 모델을 우회할 수 있는 최소한의 이미지 교란을 찾는다. 이를 위해 최적화 문제를 정의하고 효과적으로 해결하는 방법을 제안한다.
이론적 분석을 통해 제안하는 공격의 전이성을 정량적으로 분석하였다. 실험 결과, 제안하는 공격은 기존 전이 공격 기법들에 비해 월등한 성능을 보였으며, 워터마크 기반 탐지 시스템의 no-box 환경에서의 취약성을 입증하였다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések