核心概念
本文探討了深度神經網路中低秩層的存在如何影響其泛化能力,並提出了一個基於 Maurer 連鎖法則的 Gaussian 複雜度界限,該界限顯示低秩層可以防止秩和維度因子在網路層之間的累積,從而獲得比全秩層網路更好的泛化能力。
Andrea Pinto, Akshay Rangamani, Tomaso Poggio. (2024). On Generalization Bounds for Neural Networks with Low Rank Layers. arXiv:2411.13733v1 [cs.LG]
本研究旨在探討深度神經網路中低秩層的存在如何影響其泛化能力,並提出一個更精確的泛化誤差界限。