적층 제조 모니터링에서 데이터 프라이버시를 보호하면서도 머신러닝 모델의 정확성을 유지하기 위해 설명 가능한 AI와 벡터 기호 패러다임을 활용하는 차등 프라이버시-초차원 컴퓨팅(DP-HD) 프레임워크를 제안한다.
본 논문에서는 로컬 차등 프라이버시(LDP) 제약 조건 하에서 다항 분포 및 연속형 데이터에 대한 2-표본 검정 문제를 다루며, 프라이버시 보존과 통계적 효용성 사이의 균형을 유지하는 미니맥스 최적 검정 방법을 제안합니다.
민감하고 불균형한 데이터를 위한 머신러닝에서는 프라이버시를 보존하면서도 정확도를 유지하는 것이 중요하며, 본 논문에서는 데이터 증강을 위한 전처리 및 학습 프로세스를 조정하는 사후 처리 방법을 모두 활용하여 이 문제를 해결합니다. 특히, SMOTE와 같은 비공개 데이터 증강 기술이 프라이버시 손실을 증폭시킬 수 있음을 보여주고, 개인정보를 보호하는 합성 데이터 생성과 같은 대안을 제시합니다. 또한, 클래스 가중치 ERM 및 DP-SGD와 같은 사후 처리 방법을 살펴보고, 이러한 방법이 클래스 불균형을 효과적으로 해결할 수 있는 방법을 보여줍니다.
온라인 학습에서 순수 차등 프라이버시(DP)는 적응형 공격자를 처리할 때 심각한 제약이 있으며, 근사 DP가 더 적합하지만 여전히 무한한 실수를 야기할 수 있습니다. 이는 개인정보보호와 유틸리티 사이의 근본적인 트레이드 오프를 보여줍니다.
본 논문에서는 과매개변수 심층 신경망의 학습 메커니즘을 연구하기 위한 인기 있는 분석 프레임워크인 신경망 접선 커널(NTK) 회귀 설정에서 차등 프라이버시(DP) 메커니즘을 연구하여, 개인정보를 보호하면서도 높은 정확도를 유지하는 프라이빗 NTK 회귀 알고리즘을 제안하고, 이론적 분석과 실험을 통해 그 효과를 검증합니다.
본 논문에서는 레이더 기반 인간 활동 인식 시스템에서 발생하는 개인 정보 보호 문제를 다루고, 데이터 유용성을 유지하면서도 멤버십 추론 공격으로부터 사용자 정보를 보호하는 새로운 차등 프라이버시 기법인 IDG-DP를 제안합니다.
본 논문에서는 데이터의 각 특성에 대한 민감도를 고려하여 맞춤형 프라이버시 보호를 가능하게 하는 새로운 프레임워크인 베이지안 좌표 기반 차등 프라이버시(BCDP)를 제안합니다.
경계가 있는 데이터를 분석할 때 차등 프라이버시를 적용한 베이지안 추론을 수행할 경우, 데이터의 경계를 고려한 사전 분포 설정 및 분석 방법이 중요하며, 특히 정보량이 적은 사전 분포를 사용할 때는 사후 분포의 적절성을 신중하게 평가해야 한다.
사전 학습된 모델의 마지막 계층을 미세 조정하는 차등 프라이버시 학습에서 신경망 붕괴 현상을 활용하면 높은 차원의 특징 공간에서도 차원의 영향을 받지 않는 강건한 성능을 얻을 수 있지만, 특징 공간에 작은 perturbation이라도 존재하면 성능이 크게 저하될 수 있다.
LLM에 도메인 특화 지식을 효과적으로 전이하기 위해 차등 프라이버시를 보장하는 모델 기반 프레임워크인 Llamdex를 제안하며, 이는 높은 정확도와 강력한 개인 정보 보호를 동시에 제공합니다.