Core Concepts
特徴分散データに対するTSRGAアルゴリズムは、通信複雑性を低減し、高次元線形モデルの正確な推定を可能にします。
Abstract
特徴分散データの重要性と課題
データパーティショニングと通信複雑性の関係
TSRGAアルゴリズムの提案と構造
一段目の緩和貪欲アルゴリズム(RGA)の概要と停止基準
RGAの収束速度と通信コスト削減方法
二段目の緩和貪欲アルゴリズム(TSRGA)の詳細と理論的保証
ローカル情報共有とスクリーニング能力
TSRGAアルゴリズムの通信複雑性解析と応用範囲
Stats
HydraアルゴリズムはO(np log(1/ϵ))バイトの通信を必要とする。
DIDRPアルゴリズムはO(n2 +n log(1/ϵ))バイトの通信が必要。
Quotes
"The proposed TSRGA can substantially cut down the communication costs and produce even more accurate estimates than the original RGA."
"In a large-scale simulation experiment, TSRGA can effectively estimate the high-dimensional multivariate linear regression model with more than 16 GB data in less than 5 minutes."