이 논문은 연방 학습 기반 인간 활동 인식 모델에서 개인 데이터를 효율적으로 언러닝하는 방법을 제안한다.
연방 학습 환경에서 개인 데이터 언러닝의 필요성과 문제점을 설명한다. 기존 재학습 방식은 비효율적이므로 새로운 접근이 필요하다.
제안 방법은 개인 데이터 일부를 언러닝하기 위해 타 데이터셋을 활용한다. KL 발산을 손실 함수로 사용하여 언러닝 대상 데이터와 타 데이터의 출력 분포 차이를 최소화한다. 이를 통해 모델 성능 저하를 억제하면서 언러닝을 수행한다.
멤버십 추론 공격을 통해 언러닝 효과를 검증하며, 실험 결과 제안 방법이 재학습 대비 수백 배에서 수천 배 빠른 언러닝 속도를 달성한다.
타 데이터셋 선택 방식에 따른 언러닝 성능 변화를 분석하여, 데이터 분포 특성에 따라 적절한 타 데이터셋 선택이 중요함을 보인다.
To Another Language
from source content
arxiv.org
Głębsze pytania