核心概念
本文提出了一種新的方差降低梯度估計器,通過隨機更新真實梯度的一個正交方向並利用歷史快照進行方差校正,解決了現有零阶分散式優化算法在收斂速率和每次梯度估計的採樣成本之間的權衡問題。
摘要
本文研究了平滑非凸問題的分散式零阶優化。作者提出了一種新的方差降低梯度估計器(VR-GE),它通過隨機更新真實梯度的一個正交方向並利用歷史快照進行方差校正,解決了現有零阶分散式優化算法在收斂速率和每次梯度估計的採樣成本之間的權衡問題。
具體來說:
- 作者設計了VR-GE,它結合了2點和2d點梯度估計器的優點,在保持較低採樣成本的同時也能提高梯度估計的精度。
- 作者將VR-GE與梯度跟蹤機制相結合,提出了一種新的分散式零阶優化算法。
- 作者對算法的收斂性進行了嚴格的理論分析,證明了其收斂速率為O(d^(5/2)/m),其中m為函數值查詢次數。
- 數值實驗表明,與現有方法相比,所提算法在相同的採樣次數下能達到更快的收斂速度和更高的優化精度。
統計資料
所提算法的收斂速率為O(d^(5/2)/m)。
每次迭代VR-GE的平均採樣次數為4+2dp,當p=C/2d時,採樣次數與維度d無關。