Dangel, F. (2024). Convolutions and More as Einsum: A Tensor Network Perspective with Advances for Second-Order Methods. Proceedings of the 38th Conference on Neural Information Processing Systems (NeurIPS 2024).
本研究旨在探討如何利用張量網路 (TN) 簡化卷積神經網路的分析,並開發更高效的自動微分和曲率估計演算法,以提升二階優化方法在卷積神經網路上的效率。
張量網路是分析和優化卷積神經網路的強大工具,可以簡化分析、提高計算效率,並促進新演算法的開發。
本研究有助於縮小多層感知器和卷積神經網路之間的理論和演算法發展差距,並為二階優化方法在卷積神經網路上的應用提供了新的可能性。
翻譯成其他語言
從原文內容
arxiv.org
從以下內容提煉的關鍵洞見
by Felix Dangel 於 arxiv.org 10-25-2024
https://arxiv.org/pdf/2307.02275.pdf深入探究