核心概念
データセットを使わずに、制限付きボルツマンマシンの学習効率を高める重み初期化手法を提案する。
要約
本研究では、制限付きボルツマンマシン(RBM)の重み初期化手法を提案する。RBMは可視層と隠れ層から成る確率的なニューラルネットワークである。
提案手法では、可視層のバイアスを0に、隠れ層のバイアスを定数cに初期化する。重みパラメータは平均0、標準偏差βmax/√(n+m)の正規分布から初期化する。ここで、βmaxは可視層と隠れ層の相関が最大になる値として定義される。
この相関は統計力学的な解析に基づいて導出され、相関が大きいほど学習効率が高くなるという仮説に基づいている。
提案手法は、隠れ層が{-1,1}二値の場合、隠れ層サイズと可視層サイズが等しく、全バイアスが0のときはXavier初期化と一致する。
数値実験の結果、提案手法は学習効率が最も高いことが示された。今後の課題として、連続値の可視層を持つ拡張モデルへの適用や、βmaxの解析的な表現の導出が挙げられる。
統計
可視層と隠れ層の相関を表す式は以下の通りです。
χv,h ∝ ∂mh/∂b
ここで、mvは可視層の期待値、mhは隠れ層の期待値を表します。