핵심 개념
부분 기계 언러닝은 기존 모델 성능을 유지하면서도 특정 데이터의 영향을 효과적으로 제거할 수 있다.
초록
이 논문은 훈련된 기계 학습 모델에서 특정 데이터의 영향을 효과적으로 제거하는 새로운 부분 기계 언러닝 알고리즘을 제안한다.
첫 번째 방법은 부분 건망증 언러닝으로, 레이어 단위 가지치기와 건망증 언러닝을 결합한 것이다. 이 방법은 훈련 중 모델에 가해진 업데이트를 가지치기하여 저장하고, 이를 활용해 특정 데이터의 영향을 제거한다. 두 번째 방법은 레이어 단위 부분 업데이트를 라벨 뒤집기 및 최적화 기반 언러닝에 통합하여 데이터 삭제가 모델 성능에 미치는 부작용을 완화한다.
실험 결과, 부분 건망증 언러닝은 모델 성능을 유지하면서도 기존 건망증 언러닝과 달리 추가 미세 조정이 필요 없다. 또한 레이어 단위 부분 업데이트를 라벨 뒤집기 및 최적화 기반 언러닝에 적용하면 이들 방법의 성능이 향상된다.
통계
훈련 데이터에서 특정 데이터 샘플을 제거하더라도 모델이 해당 데이터에 대한 정보를 보유할 수 있다.
기존 언러닝 기법은 모델 성능 저하, 추가 미세 조정 필요, 많은 저장 공간 요구 등의 문제가 있다.
인용구
"부분 건망증 언러닝은 모델 성능을 유지하면서도 추가 미세 조정이 필요 없다."
"레이어 단위 부분 업데이트를 라벨 뒤집기 및 최적화 기반 언러닝에 적용하면 이들 방법의 성능이 향상된다."