Khái niệm cốt lõi
본 논문에서는 민감한 데이터나 개인 정보가 포함된 데이터를 머신 러닝 모델에서 효율적이고 안전하게 삭제하는 새로운 방법인 의사 확률 기반 정보 삭제(PPU) 기법을 제안합니다.
Tóm tắt
의사 확률 기반 머신 러닝 정보 삭제: 효율적이고 개인 정보를 보호하는 머신 러닝 정보 삭제 기법
본 연구는 특정 데이터셋, 즉 편향되거나, 오류가 있거나, 개인 정보를 유출할 수 있는 인스턴스를 머신 러닝 모델에서 제거하는 머신 러닝 정보 삭제 기술을 다룹니다. 데이터 프라이버시, 데이터 삭제에 대한 법적 요구 사항, 그리고 완전한 재교육 없이 새로운 정보에 적응해야 하는 모델의 필요성에 대한 우려가 커짐에 따라 이 분야의 중요성이 더욱 부각되고 있습니다.
기존 머신 러닝 정보 삭제 방법에는 두 가지 주요 과제가 있습니다. 첫째, 삭제할 특정 데이터 하위 집합을 잊는 효율성과 나머지 데이터에 대한 성능을 유지해야 할 필요성이라는 두 가지 측면에서 적절한 정보 삭제 성능을 유지하려면 모델을 재교육하지 않고도 여전히 높은 계산 시간이 필요합니다. 둘째, 기존 방법은 공격자가 사후 정보 삭제 모델에서 어떤 데이터가 삭제 집합 내에 있는지 추론할 수 있는 개인 정보 유출 공격에 취약합니다.