本研究では、制限付きボルツマンマシン(RBM)の重み初期化手法を提案する。RBMは可視層と隠れ層から成る確率的なニューラルネットワークである。
提案手法では、可視層のバイアスを0に、隠れ層のバイアスを定数cに初期化する。重みパラメータは平均0、標準偏差βmax/√(n+m)の正規分布から初期化する。ここで、βmaxは可視層と隠れ層の相関が最大になる値として定義される。
この相関は統計力学的な解析に基づいて導出され、相関が大きいほど学習効率が高くなるという仮説に基づいている。
提案手法は、隠れ層が{-1,1}二値の場合、隠れ層サイズと可視層サイズが等しく、全バイアスが0のときはXavier初期化と一致する。
数値実験の結果、提案手法は学習効率が最も高いことが示された。今後の課題として、連続値の可視層を持つ拡張モデルへの適用や、βmaxの解析的な表現の導出が挙げられる。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies