Core Concepts
アンサンブルモデルを用いずに、単一のニューラルネットワークモデルを使って効率的に誤差バーを予測する手法を提案する。
Abstract
本研究では、材料科学の3つのデータセット(拡散、ペロブスカイト、超伝導)を用いて、以下の3つのモデルを構築した:
モデルA: 予測精度を最大化するための単一のニューラルネットワークモデル
モデルAE: アンサンブルモデルを用いて誤差バーを予測するモデル
モデルB: モデルAEの予測結果を学習し、単一のニューラルネットワークモデルで誤差バーを予測するモデル
モデルBは、モデルAEの予測結果を学習データとして使うことで、アンサンブルモデルを使わずに誤差バーを予測できる。これにより、推論時の計算コストと記憶容量を大幅に削減できる。
データ拡張手法を用いて、モデルBの学習データを生成した。学習データの量を増やすことで、モデルBの予測精度が向上することが示された。ただし、特徴量空間の拡大範囲が大きすぎると、モデルBの精度が低下する傾向がある。
全体として、提案手法は材料科学分野における機械学習モデルの不確実性定量化に有効な手法であることが示された。アンサンブルモデルを使わずに、単一のニューラルネットワークモデルで効率的に誤差バーを予測できるため、計算コストと記憶容量の削減が可能となる。
Stats
拡散データセットの特徴量は20個、ペロブスカイトデータセットは70個、超伝導データセットは25個である。
特徴量は0から1の範囲にスケーリングされている。
Quotes
"アンサンブルモデルは予測の不確実性を推定するのに有効だが、N個のモデルを使うため、単一モデルに比べて計算時間とメモリ使用量がN倍大きくなる。"
"本研究では、アンサンブルモデルの予測結果を学習データとして使うことで、単一モデルで効率的に誤差バーを予測する手法を提案する。"