Core Concepts
NEONは、単一のオペレーターネットワークバックボーンを使用して不確実性を伴う予測を生成する新しいアーキテクチャであり、同等のパフォーマンスを持つ深層アンサンブルと比較して1-2桁少ない学習パラメータで実現できる。
Abstract
本論文では、オペレーター学習の分野にEpistemic Neural Network(ENN)のフレームワークを統合し、NEONと呼ばれる新しい手法を提案している。NEONは、オペレーターネットワークにEpiNetと呼ばれる小さなニューラルネットワークを追加することで、単一のモデルでエピステミック不確実性を定量化できる。
実験では、4つの合成および実世界のベンチマークを使用して、NEONが同等以上のパフォーマンスを達成しつつ、しばしば1-2桁少ない学習パラメータを使用することを示している。特に、光学干渉計の問題では、NEONが大幅な性能向上を示した。これは、より大きなネットワークの力を活用しつつ、エピステミック不確実性をキャプチャできるためである。一方、同等の強力なネットワークを持つアンサンブルでは、計算コストが大幅に高くなる。
Stats
提案手法NEONは、同等のパフォーマンスを持つ深層アンサンブルと比較して1-2桁少ない学習パラメータで実現できる。
光学干渉計の問題では、NEONが大幅な性能向上を示した。