핵심 개념
본 연구는 층화 무작위 표본 추출 상황에서 차별적 프라이버시를 보장하는 세 가지 알고리즘을 제안한다. 이를 통해 모집단 비율에 대한 신뢰구간을 안전하게 추정할 수 있다.
초록
본 연구는 층화 무작위 표본 추출 상황에서 모집단 비율에 대한 차별적 프라이버시 보장 신뢰구간 추정 방법을 제안한다.
- 표본 크기가 공개된 경우, 두 가지 알고리즘을 제안한다:
- 층 수준에서 노이즈를 추가하는 방식 (StrNz-PubSz)
- 전체 수준에서 노이즈를 추가하는 방식 (PopNz-PubSz)
- 표본 크기가 비공개인 경우, 층 수준에서 노이즈를 추가하는 알고리즘 (StrNz-PrivSz)을 제안한다.
각 알고리즘은 차별적 프라이버시 수준을 보장하며, 점근적으로 원하는 신뢰수준을 달성한다. 또한 이론적으로 각 알고리즘의 분산을 비교하여 실용적인 시사점을 제공한다.
통계
모집단 크기 N은 공개된 정보이다.
층 h의 모집단 크기 Nh와 표본 크기 nh는 공개된 정보이다.
층 h의 속성 보유 개체 수 ch는 비공개 정보이다.