Core Concepts
深層同次ニューラルネットワークの訓練中に、小さな初期化から始まる勾配フロー動態を研究し、重みが早い段階で方向性をほぼ収束することを示す。
Abstract
著者は深層同次ニューラルネットワークの訓練時に生じる勾配フロー動態を調査。
早期方向収束現象が重要であり、初期段階で興味深い挙動が現れることを示唆。
小さな初期化により、重みは小さく保たれ、特定のサドル点周辺で勾配フロー動態が類似した方向に収束することが示されている。
Introduction
ニューラルネットワークの訓練は非凸損失関数の最適化を含む。
小さな初期化の利点や特定条件下での方向収束に焦点。
Main Results
深層同次ニューラルネットワークにおける早期方向収束とサドル点周辺での類似した方向収束を確立。
初期段階で重みが近接し、特定条件下ではサドル点周辺でも類似した挙動を示す。
Related Works
大規模初期化領域ではNeural Tangent Kernel(NTK)が有効。
小さな初期化領域では非線形的なトレーニングダイナミクスが観察され、一部タスクで汎化性能が改善されることも報告されている。
Stats
"本論文は、深い同次ニューラルネットワークの訓練中に生じる勾配フロー動態を調査します。"
"小さな初期化により、重みは小さく保たれます。"
Quotes
"本論文は、深い同次ニューラルネットワークの訓練中に生じる勾配フロー動態を調査します。"
"小さな初期化により、重みは小さく保たれます。"