本論文では、ResNetの訓練における中間層の特徴量の挙動を調べ、「漸進的な順方向崩壊(Progressive Feedforward Collapse、PFC)」と呼ばれる新しい現象を提案している。
具体的には以下のような内容が示されている:
ResNetの最終層の特徴量がニューラルネットワークの崩壊(Neural Collapse、NC)を示すことが知られているが、中間層の特徴量の挙動は明らかになっていなかった。
本論文では、中間層の特徴量の崩壊度合いを表す3つの指標(PFC1、PFC2、PFC3)を定義し、ResNetの訓練過程でこれらの指標が層を深くするにつれて単調に減少することを示した。これがPFCの主張である。
PFCは、ResNetの順方向伝播が重み減衰付きでワッサーシュタイン空間上の測地線を学習するという仮定の下で理論的に説明できることを示した。
また、中間層の特徴量と最終層の特徴量の関係を捉えるための新しいモデル(MUFM)を提案し、MUFMの最適解がNCとは異なるが、入力データよりも集中度が高いことを示した。
以上のように、本論文はResNetの訓練過程における中間層の特徴量の挙動を明らかにし、その理論的な理解を深めるものである。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問