본 논문은 대규모 데이터셋의 스펙트럼 분석 및 추천 작업에 널리 사용되는 랜덤 파워 메서드의 개인정보 보호 문제를 다룹니다. 특히, 민감한 개인 정보를 포함하는 현대 데이터셋에서 이 메서드를 사용할 때 발생할 수 있는 프라이버시 유출에 대한 공식적인 보증을 제공하는 데 중점을 둡니다.
기존의 차분 프라이버시 랜덤 파워 메서드는 계산되는 특이 벡터의 수에 따라 성능이 크게 좌우되며, 주로 신뢰할 수 있는 중앙 서버가 데이터를 보유하고 있다고 가정하는 중앙 집중식 설정을 위해 설계되었습니다. 또한 일부 기존 연구에서는 데이터 분포에 대한 강력한 가정(예: 데이터가 부분 가우시안)을 하기 때문에 실제로 이러한 방법을 사용하기 어렵습니다.
본 논문에서는 차분 프라이버시(DP)를 달성하기 위해 도입된 노이즈의 분산을 줄이는 전략을 제안하여 기존 방법의 한계를 해결합니다. 또한 정확도를 유지하면서 계산 및 통신 오버헤드가 낮은 분산 프레임워크에 맞게 메서드를 조정합니다. 구체적으로, 개별 데이터를 공개하지 않고도 여러 사용자 또는 장치에 분산된 데이터를 사용하여 알고리즘이 계산을 수행할 수 있도록 안전한 집계(멀티 파티 계산의 한 형태)를 활용합니다.
본 논문에서는 분산 설정에서 중앙 집중식 설정과 유사한 노이즈 스케일을 사용할 수 있음을 보여줍니다. 또한 중앙 집중식 및 분산 버전 모두에 대해 기존의 수렴 범위를 개선합니다. 제안된 방법은 프라이버시 문제가 가장 중요한 분산 추천 시스템과 같은 분산 애플리케이션에 특히 적합합니다.
לשפה אחרת
מתוכן המקור
arxiv.org
שאלות מעמיקות