核心概念
新しいクラスのLangevinベースのアルゴリズムは、深層学習における勾配の課題を克服する。
要約
多くの人気ある最適化アルゴリズムが直面する問題を解決する新しいクラスのLangevinベースのアルゴリズムが提案された。このアルゴリズムは、爆発的な勾配問題と消失勾配問題を効果的に対処し、実世界のデータセットで優れた性能を示すことが示されている。数値実験では、他の人気のある最適化アルゴリズムと比較して、TheoPouLaが迅速に最適解に収束することが確認された。
統計
λmax = min(1, 1/4η^2)
Wasserstein-1 distance convergence rate: λ^1/2
Wasserstein-2 distance convergence rate: λ^1/4
引用
"The new algorithm TheoPouLa rapidly finds the optimal solution only after 200 iterations."
"The taming function of TheoPouLa controls the super-linearly growing gradient effectively."
"The empirical performance of TheoPouLa on real-world datasets shows superior results over popular optimization algorithms."