核心概念
ニューラルネットワークの学習は、対応する場理論における情報理論的な「赤外」から「紫外」への流れと解釈でき、ベイズ的繰り込み群を用いることで、この流れを逆転させ、「紫外」から「赤外」への流れを構築できる。
本論文は、ニューラルネットワーク(NN)の学習ダイナミクスを、対応する統計的場理論(SFT)における情報理論的な「赤外」から「紫外」への流れとして解釈する、新しい枠組みを提案しています。この枠組みは、NNのアーキテクチャをSFTの空間にマッピングするニューラルネットワーク場理論対応(NNFT)と、情報理論に基づいた粗視化スキームであるベイズ的繰り込み群(BRG)を統合したものです。
背景
NNの性能向上や、ロバスト性、解釈可能性、不確実性推定への関心が高まる中、NNの理論的な記述を得ることが重要となっています。ベイズ的ニューラルネットワーク(BNN)は、NNの学習にベイズ推定を適用することで、これらの問題に取り組むための統計的に確立された方法を提供します。一方、NNとSFTを関連付ける代替的な枠組みも提案されており、凝縮系物理学や高エネルギー物理学におけるSFTの理論的な洞察を活用できる可能性があります。
NNFTとBRGの統合
NNFT対応は、NNのアーキテクチャとパラメータ分布から、対応するSFTの作用を導出します。この対応により、NNの出力関数はSFTからサンプリングされた場とみなすことができます。BRGは、フィッシャー情報量メトリックによって設定された情報理論的な識別可能性スケールに関して、パラメータ空間で粗視化を実行する情報理論的な粗視化スキームです。
本論文では、NNFTとBRGを統合し、BRG-NNFTと呼ばれる新しい枠組みを提案しています。BRG-NNFTを用いることで、NNの学習ダイナミクスを、SFT空間における情報理論的な「赤外」から「紫外」への流れとして解釈することができます。逆に、学習済みネットワークのパラメータに情報シェルの粗視化を適用すると、SFT空間における情報理論的な「紫外」から「赤外」への流れが誘起されます。
解析と実験結果
本論文では、BRG-NNFT対応を、解析的に扱いやすい2つの例で実証しています。まず、任意の深さと活性化関数を持つ、学習済み無限幅NNのBRGフローを構築します。次に、単一の無限幅層、スカラー出力、一般化コサインネット活性化を持つアーキテクチャに限定します。この場合、BRGの粗視化は、自由スカラーSFTの運動量シェルERGフローと正確に対応することを示しています。これらの解析結果は、漸近的に幅の広いNNのアンサンブルを学習させ、情報シェルBRGスキームを用いて繰り込む数値実験によって裏付けられています。
結論
BRG-NNFTは、NNアーキテクチャをSFTの観点から表現するための新しい枠組みを提供します。この対応は、エキゾチックなSFTの表現を構築したり、NNの学習挙動における興味深い現象を研究するための新しい枠組みとして使用できる可能性があります。