이 논문은 모델 역전 공격에 대한 강건한 신경망 아키텍처를 제안한다. 최근 모델 역전 공격은 신경망의 매개변수나 분류 결과만으로도 학습 데이터를 재구성할 수 있는 심각한 프라이버시 위협으로 대두되고 있다. 이에 대한 다양한 방어 기법이 제안되었지만, 분류 정확도와 트레이드오프가 있거나 복잡한 튜닝이 필요하다는 한계가 있다.
이 논문에서는 희소 부호화 기반 신경망 아키텍처 SCA를 제안한다. SCA는 희소 부호화 계층과 밀집 계층을 교대로 배치하여, 학습 데이터의 불필요한 정보를 제거하는 방식으로 모델 역전 공격에 강건하다. 실험 결과, SCA는 다양한 데이터셋과 공격 시나리오에서 기존 방어 기법 대비 1.1배에서 720배 더 우수한 재구성 품질 지표를 보였으며, 분류 정확도 또한 유사하거나 더 높은 수준을 달성했다. 특히 SCA는 복잡한 튜닝 없이도 강력한 방어 성능을 보였다.
이 연구는 모델 역전 공격 취약성과 희소 부호화 기법 간의 깊은 연관성을 보여주며, 향후 프라이버시 보호를 위한 신경망 아키텍처 설계에 중요한 시사점을 제공한다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문