Core Concepts
안정적인 확산 모델을 활용하여 대체 모델 학습에 필요한 데이터를 효율적이고 정확하게 생성하는 방법을 제안한다.
Abstract
이 논문은 데이터 없는 대체 공격 문제를 다룹니다. 기존의 GAN 기반 방식은 생성 데이터의 품질이 낮고 효율성이 낮은 문제가 있었습니다. 이를 해결하기 위해 저자들은 안정적인 확산 모델(Stable Diffusion)을 활용하여 데이터를 생성하는 방법을 제안합니다.
구체적으로 다음과 같은 과정을 거칩니다:
안정적인 확산 모델을 이용해 초기 데이터를 생성합니다.
멤버십 추론 기법을 사용하여 이 데이터 중 타겟 모델의 학습 데이터와 유사한 데이터를 식별합니다.
식별된 데이터의 잠재 코드를 증강하는 기법(LCA)을 제안하여, 안정적인 확산 모델이 타겟 모델의 데이터 분포와 유사한 데이터를 생성하도록 유도합니다.
생성된 데이터를 이용하여 대체 모델을 학습합니다.
실험 결과, 제안 기법은 기존 GAN 기반 방식에 비해 더 높은 공격 성공률과 더 적은 질의 횟수로 우수한 성능을 보였습니다.
Stats
안정적인 확산 모델로 생성한 데이터는 클래스 간 정확도 편차가 크고 전체 평균 정확도가 낮다.
제안한 LCA 기법으로 생성한 데이터는 클래스 간 정확도 편차가 작고 전체 평균 정확도가 높다.
Quotes
"안정적인 확산 모델로 생성한 데이터는 도메인 분포와 양/음성 샘플의 편차가 크다."
"LCA 기법을 통해 생성한 데이터는 타겟 모델의 데이터 분포와 잘 부합하며 높은 다양성을 보인다."