核心概念
本文修正了先前論文中關於局部資訊隱私 (LIP) 機制有效隱私參數範圍的錯誤,並提出了一種基於分組的演算法來擴展有效隱私參數的範圍。
摘要
論文更正說明
本文件旨在更正先前發表的論文「局部資訊隱私及其在數據聚合中的應用」中關於局部資訊隱私 (LIP) 機制有效隱私參數範圍的錯誤。
主要修正內容
-
有效隱私參數範圍的修正: 原論文聲稱所提出的 LIP 機制滿足 (ϵ, 0)-LIP,其中 ϵ > 0 且適用於任意 PX。然而,此說法並不完全正確。本文件修正了該機制有效隱私參數的範圍,並證明了其僅在 ϵ 大於特定閾值時才滿足 (ϵ, 0)-LIP。
-
基於分組的演算法: 為了擴展有效隱私參數的範圍,本文件提出了一種基於分組的演算法。該演算法通過將具有較小先驗概率的輸入數據進行分組,以提高 Pmin(最小先驗概率),從而實現更小的 ϵ 值。
-
對原論文實驗結果的影響: 本文的分析僅針對 ϵ 的有效範圍進行了修正,並未改變機制的任何參數。因此,原論文中的實驗結果仍然有效,只是需要根據本文的分析結果重新計算 ϵ 的範圍。
其他討論
- 本文還討論了在實際應用中,局部隱私保護模型通常採用較大的 ϵ 值以提供良好的效用。
- 本文指出,GRR(廣義隨機響應)機制在處理高維數據時存在效用-隱私權衡不佳的問題,而本文提出的基於分組的演算法可以有效解決這個問題。
統計資料
Apple 在其基於 LDP 的計數均值草圖協議中選擇 ϵ = 8 來收集域名信息,ϵ = 4 來收集表情符號信息。
引述
"The analysis presented in this document focuses solely on the valid range of ϵ and does not alter any of the mechanism’s parameters. Consequently, the experimental results from the original paper remain valid, with the only change being an updated ϵ range recalculated based on the analysis in this correction."