Belangrijkste concepten
본 논문에서는 로컬 차등 프라이버시(LDP) 제약 조건 하에서 다항 분포 및 연속형 데이터에 대한 2-표본 검정 문제를 다루며, 프라이버시 보존과 통계적 효용성 사이의 균형을 유지하는 미니맥스 최적 검정 방법을 제안합니다.
Samenvatting
로컬 차등 프라이버시 하에서 미니맥스 최적의 2-표본 검정
본 연구는 로컬 차등 프라이버시(LDP) 제약 조건 하에서 다항 분포 및 연속형 데이터에 대한 2-표본 검정 문제를 다루고, 프라이버시를 보존하면서도 통계적 효용성을 극대화하는 검정 방법을 개발하는 것을 목표로 합니다.
다항 분포 데이터에 대해 라플라스, 이산 라플라스, 구글의 RAPPOR와 같은 실용적인 프라이버시 메커니즘을 사용한 순열 검정 방법을 제안합니다.
연속형 데이터의 경우, 구간화를 통해 다항 분포 접근 방식을 확장하고, 횔더 및 베소프 부드러움 클래스에 대한 LDP 하에서 균일한 분리 비율을 연구합니다.
미니맥스 분리 비율을 달성하기 위해 U-통계량 기반 검정 통계량을 사용하고, 순열 절차를 통해 유한 표본 크기에 대한 타입 I 오류를 제어합니다.
정보 이론적 하한을 도출하여 제안된 검정 방법의 최적성을 증명하고, LDP 하에서 프라이버시와 통계적 검정력 사이의 근본적인 트레이드 오프를 분석합니다.
부드러움 매개변수를 모르는 경우에도 강력한 성능을 보장하는 Bonferroni 유형 접근 방식을 기반으로 하는 적응형 검정 방법을 제안합니다.