본 논문은 대규모 데이터셋의 스펙트럼 분석 및 추천 작업에 널리 사용되는 랜덤 파워 메서드의 개인정보 보호 문제를 다룹니다. 특히, 민감한 개인 정보를 포함하는 현대 데이터셋에서 이 메서드를 사용할 때 발생할 수 있는 프라이버시 유출에 대한 공식적인 보증을 제공하는 데 중점을 둡니다.
기존의 차분 프라이버시 랜덤 파워 메서드는 계산되는 특이 벡터의 수에 따라 성능이 크게 좌우되며, 주로 신뢰할 수 있는 중앙 서버가 데이터를 보유하고 있다고 가정하는 중앙 집중식 설정을 위해 설계되었습니다. 또한 일부 기존 연구에서는 데이터 분포에 대한 강력한 가정(예: 데이터가 부분 가우시안)을 하기 때문에 실제로 이러한 방법을 사용하기 어렵습니다.
본 논문에서는 차분 프라이버시(DP)를 달성하기 위해 도입된 노이즈의 분산을 줄이는 전략을 제안하여 기존 방법의 한계를 해결합니다. 또한 정확도를 유지하면서 계산 및 통신 오버헤드가 낮은 분산 프레임워크에 맞게 메서드를 조정합니다. 구체적으로, 개별 데이터를 공개하지 않고도 여러 사용자 또는 장치에 분산된 데이터를 사용하여 알고리즘이 계산을 수행할 수 있도록 안전한 집계(멀티 파티 계산의 한 형태)를 활용합니다.
본 논문에서는 분산 설정에서 중앙 집중식 설정과 유사한 노이즈 스케일을 사용할 수 있음을 보여줍니다. 또한 중앙 집중식 및 분산 버전 모두에 대해 기존의 수렴 범위를 개선합니다. 제안된 방법은 프라이버시 문제가 가장 중요한 분산 추천 시스템과 같은 분산 애플리케이션에 특히 적합합니다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Juli... às arxiv.org 11-05-2024
https://arxiv.org/pdf/2411.01931.pdfPerguntas Mais Profundas