核心概念
ランダムな直交射影と部分サンプリングを組み合わせることで、分散線形回帰の計算を高速化しつつ、情報の安全性と遅延耐性を確保する。
要約
本論文では、分散線形回帰の高速化と安全性確保のために、反復スケッチング手法を提案している。具体的には以下の手順を踏む:
データ行列Aに対して、ランダムな直交行列Πを適用して基底を回転させる。これにより、情報の安全性が確保される。
回転後のデータを、サーバ間で均等にブロック分割する。
各サーバは割り当てられたブロックに対して計算を行い、その結果を中央サーバに送信する。
中央サーバは、一定数のサーバからの応答を受け取った時点で、ステップ幅を最適化しつつ、勾配降下法による更新を行う。
この手法により、以下の特徴が得られる:
遅延耐性: 一部のサーバが遅延しても、他のサーバからの応答で計算を進めることができる
安全性: ランダムな直交射影によりデータが保護される
効率性: ブロック分割と部分サンプリングにより、計算コストを削減できる
収束性: 最適なステップ幅を選択することで、反復回数を削減できる
統計
Aの正規直交基底Uを用いると、スケッチング行列SΠは以下の性質を満たす:
Id - (SΠU)T(SΠU) 2 ≤ ε
これにより、近似解ˆxlsの誤差は以下のように抑えられる:
Aˆxls - b 2 ≤ (1 + O(ε)) Ax⋆ls - b 2
A(x⋆ls - ˆxls) 2 ≤ ε (IN - UUT)b 2