本研究では、ニューラルネットワークの線形接続性と置換に関する3つの異なる概念を定義し、それらの実証的な検証を行っている。
まず、弱い線形接続性(WLC mod P)は、ネットワーク間のペアごとに異なる置換を見つけることで線形接続性を確保するものである。一方、強い線形接続性(SLC mod P)は、全てのネットワークに対して単一の置換を見つけることで線形接続性を確保するものである。
実験の結果、SGD学習の過程で得られるネットワークの系列は、同時的な弱い線形接続性(simultaneous WLC mod P)を持つことが示された。つまり、2つの独立に学習したネットワークの系列を同時に線形接続させる単一の置換が存在することが分かった。同様の結果は、反復的な剪定によって得られる疎なサブネットワークの系列についても確認された。
さらに、3つのネットワークを同時に整列させることで、十分に幅の広いネットワークでは強い線形接続性(SLC mod P)が成り立つ可能性が示唆された。
一方で、重みマッチングと活性化マッチングという2つの整列手法の比較から、活性化マッチングの方が一般的に頑健であることが分かった。重みマッチングは学習の後期に現れる大きな重みに依存しており、初期層の整列は早期に行われることが明らかになった。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Ekansh Sharm... at arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06498.pdfDeeper Inquiries