核心概念
本文提出了一種新的深度神經網絡架構 - 切比雪夫特徵神經網絡(CFNN),能夠實現機器精度的函數逼近。CFNN 在第一個隱藏層使用可學習頻率的切比雪夫函數,並結合多階段訓練策略,可以在訓練過程中達到機器精度。通過大量數值實驗,證明了該方法在各種維度上的有效性和可擴展性。
摘要
本文提出了一種新的深度神經網絡架構 - 切比雪夫特徵神經網絡(CFNN),用於實現高精度的函數逼近。
CFNN 的主要特點如下:
-
第一個隱藏層使用可學習頻率的切比雪夫函數作為激活函數,利用切比雪夫函數優秀的函數逼近性能,同時參數較 Fourier 特徵網絡更少。
-
採用指數分佈隨機採樣策略初始化切比雪夫頻率,避免了 Fourier 特徵網絡中頻率參數選擇的困難。
-
提出了一種多階段訓練策略,通過逐步逼近殘差,最終可以達到機器精度的逼近精度。
作者通過大量的數值實驗,驗證了 CFNN 在光滑函數和非光滑函數、低維和高維等情況下的優秀逼近能力。對於一維函數,CFNN 可以達到 O(10^-14) 的機器精度;對於高維函數,即使在 20 維的情況下,也可以達到 O(10^-2) 的精度。這些結果表明 CFNN 是一種非常有效的高精度函數逼近方法。
統計資料
對於一維線性函數 f1(x) = x,4階段CFNN訓練誤差可達O(10^-28)。
對於一維光滑非線性函數 f2(x) = sin(2x + 1) + 0.2e^(1.3x),4階段CFNN訓練誤差可達O(10^-28)。
對於一維光滑非線性函數 f3(x) = |sin(πx)|^2,4階段CFNN訓練誤差可達O(10^-28)。
對於一維高頻振盪函數 f4(x) = (1-x^2)/2 * cos(30x + 0.5x^3),4階段CFNN訓練誤差可達O(10^-7)。
對於一維C0函數 f5(x) = |x|,4階段CFNN訓練誤差可達O(10^-22)。
對於一維不連續函數 f6(x) = sign(x),4階段CFNN訓練誤差可達O(10^-18)。
對於20維線性函數 f7(x),20階段CFNN訓練誤差可達O(10^-9)。
對於20維高斯峰函數 f8(x),20階段CFNN訓練誤差可達O(10^-9)。
對於20維多峰函數 f9(x),20階段CFNN訓練誤差可達O(10^-8)。
引述
"本文提出了一種新的深度神經網絡架構 - 切比雪夫特徵神經網絡(CFNN),能夠實現機器精度的函數逼近。"
"CFNN 在第一個隱藏層使用可學習頻率的切比雪夫函數,並結合多階段訓練策略,可以在訓練過程中達到機器精度。"
"通過大量數值實驗,證明了該方法在各種維度上的有效性和可擴展性。"