核心概念
本文提出了一種新的幾何異質性概念 - 角度異質性,並利用此概念分析和比較了兩類分散式線性系統求解器 - 基於投影的方法和基於優化的方法的最佳收斂速率。結果表明,當存在較大的跨機器角度異質性時,基於投影的方法如APC的收斂速率優於基於優化的方法如D-HBM。
摘要
本文研究了在分散/聯邦環境中求解大規模線性方程組的問題。任務主管利用一組機器來解決這個問題,每台機器都擁有方程組的一個子集。雖然已經有多種解決這個問題的方法,但缺乏對兩大類算法 - 投影法和優化法的收斂速率的嚴格比較。
本文提出了一個新的幾何異質性概念 - 角度異質性,並使用它來分析和比較這兩類算法的最佳收斂速率。具體來說:
我們引入了一個新的、幾何性質的數據異質性概念 - 角度異質性,並討論了它的一般性。
我們利用角度異質性的概念,對幾種著名的算法的最佳收斂速率進行了表征和比較,並捕捉了機器數量、方程數量以及跨機器和局部數據異質性對這些速率的影響。
我們的分析不僅確立了在存在大數據異質性的現實情況下,APC的優越性,而且還提供了關於角度異質性對所研究方法效率的影響的多方面見解。
作為我們研究的副產品,我們得到了一個關於任意正方形矩陣的條件數的緊致上界,其表達式涉及矩陣行的歐氏範數和它們之間的角度。
我們通過數值分析驗證了理論結果,確認了APC在典型的現實世界設置中的優越性能,並提供了對角度異質性影響的更深入理解。
統計資料
機器數量m和方程數量n會影響收斂速率。
跨機器角度異質性θH和局部角度異質性ϕi會影響收斂速率。
矩陣A的行向量範數的變化會影響收斂速率。
引述
"我們提出了一個新的、幾何性質的數據異質性概念 - 角度異質性,並討論了它的一般性。"
"我們的分析不僅確立了在存在大數據異質性的現實情況下,APC的優越性,而且還提供了關於角度異質性對所研究方法效率的影響的多方面見解。"