本研究では、3層のフィードフォワードニューラルネットワークの学習過程における重み動力学を数学的に記述し、局所的な安定性指標を計算することで、学習の成功と動力学的な性質との関係を明らかにしている。
具体的には以下の点が明らかになった:
重み初期化の方法によって、学習結果の分布が大きく変化する。He初期化では学習結果が安定しているのに対し、広範囲の初期化では学習結果のばらつきが大きい。
He初期化の場合、ReLU活性化関数を使うと、学習が失敗する(高い損失関数値)ケースが存在する。この失敗ケースでは、リアプノフ指数の解析から、学習過程の動力学が混沌状態になっていることが分かった。
リアプノフ指数や共変リアプノフベクトルの角度を監視することで、学習の成功や失敗を訓練初期の段階で予測できることが示された。特に、安定方向のリアプノフ指数や共変リアプノフベクトルの角度が有効な指標となる。
以上より、ニューラルネットワークの学習過程を力学系として捉えることで、学習の成功と動力学的な性質との関係を明らかにできることが示された。この知見は、より大規模なネットワークの学習過程を理解する上で有用であると考えられる。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Nahal Sharaf... kl. arxiv.org 05-03-2024
https://arxiv.org/pdf/2405.00743.pdfDybere Forespørgsler