核心概念
本文提出了一種新的聯邦學習算法RFedAGS,它通過平均梯度流的方式在黎曼流形上進行優化。該算法在一般非凸問題和滿足黎曼Polyak-Łojasiewicz條件的問題上都有良好的收斂性能。
摘要
本文提出了一種新的聯邦學習算法RFedAGS,用於解決定義在黎曼流形上的優化問題。與現有的黎曼聯邦學習算法相比,RFedAGS有以下特點:
提出了一種新的服務器聚合方式,即平均梯度流。這種聚合方式可以更好地概括FedAvg算法,並且在理論分析上更加方便。
在一般非凸問題和滿足黎曼Polyak-Łojasiewicz條件的問題上,RFedAGS都有良好的收斂性能。具體而言:
對於一般非凸問題,RFedAGS在固定步長下可以達到亞線性收斂速度,在衰減步長下可以實現全局收斂。
對於滿足黎曼Polyak-Łojasiewicz條件的問題,RFedAGS在固定步長下可以線性收斂到最優值附近的一個小區域,在衰減步長下可以子線性收斂到最優值。
RFedAGS理論上可以支持多個代理參與本地訓練,且每個代理可以進行多步SGD更新,這與現有的黎曼聯邦學習算法有所不同。這樣可以減少通信開銷。
RFedAGS可以適用於一般的黎曼流形,而不像某些現有算法只能處理嵌入在歐氏空間中的緊致子流形。
實驗結果驗證了RFedAGS的有效性,並且表明其性能可以與一些集中式方法相媲美。
統計資料
在固定步長下,RFedAGS的收斂速度為O(1/√T),其中T為外循環迭代次數。
在滿足黎曼Polyak-Łojasiewicz條件的問題中,RFedAGS在固定步長下的目標值線性收斂到最優值附近的一個小區域,區域直徑為O(¯ασ2/¯B),其中¯α為步長,σ2為梯度估計器的方差,¯B為批量大小。