核心概念
ニューラルアーキテクチャの出力統計に基づいて、未訓練の状態でそのポテンシャルを評価することができる。
摘要
本論文は、ニューラルアーキテクチャ検索(NAS)における新しい手法を提案している。
- 2つの一定の共有重み初期化を用いて、ニューラルアーキテクチャの出力統計を評価する。
- 出力の分散と平均出力の大きさの比率を表すεメトリックを提案する。
- εメトリックは、ラベル付きデータや勾配計算を必要とせず、NASプロセスから訓練ハイパーパラメータ、損失関数、人手ラベル付けデータを切り離すことができる。
- NAS-Bench-101、NAS-Bench-201、NAS-Bench-NLPのベンチマークデータセットで評価した結果、εメトリックは既存の手法よりも高い相関を示した。
- εメトリックは既存のNASアルゴリズムに簡単に統合でき、単一のネットワークの評価に要する時間は非常に短い。
統計資料
未訓練の状態でのニューラルアーキテクチャの出力分散は、訓練後の精度と正の相関がある。
出力分散を平均出力の大きさで正規化すると、この相関はさらに改善される。
引述
"ニューラルアーキテクチャの出力統計に基づいて、未訓練の状態でそのポテンシャルを評価することができる。"
"εメトリックは、ラベル付きデータや勾配計算を必要とせず、NASプロセスから訓練ハイパーパラメータ、損失関数、人手ラベル付けデータを切り離すことができる。"