Core Concepts
확산 모델은 데이터 합성에 매우 성공적이지만, 민감한 데이터에 적용될 경우 심각한 프라이버시 문제를 야기할 수 있다. 이 연구에서는 확산 모델에 대한 최초의 속성 추론 공격 연구를 체계적으로 수행하고, 이를 완화하기 위한 새로운 모델 독립적 플러그인 방법인 PriSampler를 제안한다.
Abstract
이 연구는 확산 모델에 대한 최초의 체계적인 속성 추론 공격 연구를 수행한다. 구체적으로:
실용적인 공격 시나리오에서 다양한 확산 모델과 샘플러에 대한 속성 추론 공격을 평가한다. 실험 결과, 다양한 확산 모델과 샘플러가 모두 속성 추론 공격에 취약한 것으로 나타났다.
오프더쉘 사전 학습 확산 모델에 대한 사례 연구를 수행하여 실제 환경에서의 공격 효과를 입증한다.
확산 모델의 속성 추론을 완화하기 위한 새로운 모델 독립적 플러그인 방법인 PriSampler를 제안한다. PriSampler는 기존 확산 모델에 직접 적용 가능하며, 확률론적 및 결정론적 샘플링을 모두 지원한다. 광범위한 실험을 통해 PriSampler의 효과를 입증하였으며, 차별적 프라이버시 기반 확산 모델 대비 우수한 성능을 보였다.
Stats
확산 모델 DDPM, SMLD, VPSDE, VESDE에 대해 다양한 속성 비율(10%, 20%, 30%, 40%, 50%)의 데이터셋으로 학습
샘플러로 PC 샘플러, ODE 샘플러, DPM 샘플러 사용
속성 추론 공격 결과, 최선의 경우 0% 절대 차이, 최악의 경우 6.8% 절대 차이 달성
Quotes
"확산 모델은 데이터 합성에 매우 성공적이지만, 민감한 데이터에 적용될 경우 심각한 프라이버시 문제를 야기할 수 있다."
"다양한 확산 모델과 샘플러가 모두 속성 추론 공격에 취약한 것으로 나타났다."
"PriSampler는 기존 확산 모델에 직접 적용 가능하며, 차별적 프라이버시 기반 확산 모델 대비 우수한 성능을 보였다."