핵심 개념
도메인 시프트 문제를 완화하는 새로운 정규화 항과 평탄한 최소값 탐색 기법을 통해 GAN 기반 이미지 변환 모델을 효과적으로 추출할 수 있다.
초록
이 논문은 GAN 기반 이미지 변환 모델에 대한 모델 추출 공격(MEA)을 다룹니다. 기존 MEA 연구는 주로 분류 모델을 대상으로 했지만, 이미지 변환 모델에는 적용하기 어려운 한계가 있습니다.
이 논문에서는 도메인 시프트 문제가 MEA 성능에 핵심적인 요인임을 밝히고, 이를 완화하는 새로운 접근법을 제안합니다. 구체적으로 다음과 같은 두 가지 핵심 기법을 도입합니다:
웨이블릿 정규화: 입력 이미지와 피해자 모델 출력 간 고주파 성분 차이를 최소화하여 모델 복잡도를 낮추고 출력 일관성을 높입니다.
평탄한 최소값 탐색: 샤프니스 인식 최적화(SAM)를 GAN 학습에 적용하여 도메인 시프트로 인한 모드 붕괴 문제를 완화합니다.
제안 기법은 다양한 이미지 변환 작업(스타일 변환, 초해상도)에서 기존 방법 대비 큰 성능 향상을 보였습니다. 또한 실제 상용 이미지 변환 서비스에 대한 공격에서도 높은 효과를 입증했습니다.
통계
피해자 모델의 출력 이미지와 공격 모델의 출력 이미지 간 고주파 성분 차이가 크다.
공격 데이터 분포와 피해자 모델 학습 데이터 분포 간 차이가 크다.
인용구
"도메인 시프트 문제는 MEA 성능에 핵심적인 요인이다."
"웨이블릿 정규화와 평탄한 최소값 탐색을 통해 GAN 기반 이미지 변환 모델을 효과적으로 추출할 수 있다."