核心概念
提出了一种新的球面数据回归分析算法T-kernel SGD,该算法通过动态调整假设空间的维度来平衡偏差和方差,并且可以在恒定步长下达到最优收敛率。
要約
本文提出了一种新的球面数据回归分析算法T-kernel SGD。该算法受球面谐波函数的结构启发,采用最小二乘损失函数,利用"截断"操作应用基于级数的核函数,从而避免了在高维空间中寻找合适闭式核函数的困难。
与传统的核SGD相比,T-kernel SGD通过动态调整假设空间的维度来更有效地平衡偏差和方差,克服了核SGD固有的饱和问题。此外,利用球面多项式的结构,可以设计出一个等价的T-kernel SGD算法,大幅降低了存储和计算成本。
在目标函数足够光滑的情况下,T-kernel SGD只需要O(n1+d/(d-1)ε)的计算复杂度和O(nd/(d-1)ε)的存储复杂度就可以达到最优收敛率,其中0<ε<1/2可以任意小。这些结果定量描述了先验信息如何影响T-kernel SGD的收敛性。
統計
球面数据回归问题的目标是在未知联合分布μ的情况下,推断解释变量X(取值于球面Sd-1)和响应变量Y(取值于实数集R)之间的函数关系。
提出的T-kernel SGD算法可以在恒定步长下达到最优收敛率,克服了传统核SGD算法中步长衰减率控制的困难。
T-kernel SGD的计算复杂度为O(n1+d/(d-1)ε),存储复杂度为O(nd/(d-1)ε),其中0<ε<1/2可以任意小,这大大优于传统核SGD的复杂度。
引用
"T-kernel SGD 通过动态调整假设空间的维度来更有效地平衡偏差和方差,克服了核SGD固有的饱和问题。"
"在目标函数足够光滑的情况下,T-kernel SGD只需要O(n1+d/(d-1)ε)的计算复杂度和O(nd/(d-1)ε)的存储复杂度就可以达到最优收敛率,其中0<ε<1/2可以任意小。"