Core Concepts
二層ニューラルネットワークの平均場解析を通じて、カーネルメソッドの視点から特徴学習能力を探究する。
Abstract
深層学習とカーネルメソッドの関係性に焦点を当てた理論的理解が限られている。
平均場解析は非凸最適化問題を凸最適化問題に変換し、グローバル収束を示す。
カーネル誘導による2層ニューラルネットワークのトレーニングとカーネル学習の関連性が明確化される。
メインフィールド・ランジュバンダイナミクス(MFLD)による収束保証が提供され、時間および粒子離散化誤差が導出される。
2つのタイムスケール制限を導入して、第1層と第2層の動態を分離し、最適なカーネル選択が可能となる。
Stats
第1層は第1引数に対して2回微分可能であり、定数cR, cL > 0が存在し、∥∇wh(x; w)∥2 ≤ cR, ∥∇2wh(x; w)∥op ≤ cLである。
Quotes
"Several works studied the relation between deep learning and kernel methods."
"The convergence of the MFLD depends on the convexity of the functional and the properties of the proximal Gibbs distribution."
"Feature learning is essential to obtain good generalization results for a union of multiple RKHSs."