核心概念
儘管隨機梯度下降(SGD)和偏置隨機組織(BRO)的噪聲來源不同,但它們在神經網路訓練中表現出相似的動態行為,特別是在接近臨界點時,兩者都收斂到相同的臨界堆積分數,並展現出與曼納普適性類別一致的行為。
摘要
隨機梯度下降的吸收態動力學研究
本研究論文探討了隨機梯度下降(SGD)在神經網路訓練中的吸收態動力學,特別是將其與偏置隨機組織(BRO)模型進行比較分析。
本研究旨在探討 SGD 與 BRO 模型在神經網路訓練中的動態行為,特別是在神經狀態空間中模擬神經流形的堆積過程。
研究人員採用了一個簡化的模型,將 SGD 應用於物理空間中的球形粒子,並將其與 BRO 模型進行比較。他們分析了不同批次大小和學習率下 SGD 和 BRO 的動態行為,並測量了臨界堆積分數、平均平方位移和能量波動等指標。