핵심 개념
本文提出了一種基於平均剪裁的私密隨機梯度下降算法(AClipped-dpSGD),能夠有效處理重尾數據,並建立了其在(強)凸和非光滑目標函數下的高概率收斂性分析。該算法相比於現有方法,在梯度複雜度和收斂速度方面都有顯著改進。
초록
本文研究了在保證差分隱私的前提下,如何有效地處理重尾數據的凸優化問題。主要貢獻如下:
-
提出了一種基於平均剪裁的私密梯度估計器(AClip),並分析了其偏差和方差性質。相比於現有的逐樣本剪裁策略,AClip的偏差隨批量大小遞減,從而能夠更好地控制估計誤差。
-
基於AClip提出了AClipped-dpSGD算法,並在凸和強凸目標函數下建立了其高概率收斂性分析。結果顯示,AClipped-dpSGD在梯度複雜度和收斂速度方面都優於現有的DP-GD和DP-SGD方法。
-
對於強凸目標,提出了重啟版本的AClipped-dpSGD算法(R-AClipped-dpSGD),並給出了其高概率收斂性分析。該結果顯著改進了現有工作。
-
考慮了更一般的非光滑目標函數(滿足廣義光滑性條件),提出了相應的AClipped-dpSGD算法及其高概率收斂性分析。
總的來說,本文提出的算法和理論分析為在保證差分隱私的前提下有效處理重尾數據的凸優化問題提供了新的思路和方法。
통계
對於受限凸優化問題,AClipped-dpSGD的超額風險界為 ˜O
d1/7√
log(n/βd2)
(nϵ)2/7
。
2. 對於無約束凸優化問題,AClipped-dpSGD的超額風險界為 ˜O
d1/7 log(n/βd2)
(nϵ)2/7
。
3. 對於強凸優化問題,R-AClipped-dpSGD的超額風險界為 ˜O
d1/2L2
µ3nϵ
。
4. AClipped-dpSGD的總梯度複雜度為 ˜O
max
n
n
2
7 d
6
7 , n
6
7 d
4
7
o
,優於現有方法。
인용구
"本文提出了一種基於平均剪裁的私密隨機梯度下降算法(AClipped-dpSGD),能夠有效處理重尾數據,並建立了其在(強)凸和非光滑目標函數下的高概率收斂性分析。"
"相比於現有的DP-GD和DP-SGD方法,AClipped-dpSGD在梯度複雜度和收斂速度方面都有顯著改進。"