核心概念
本研究では、XGBoostを用いて数値気象予報モデルの出力を後処理することで、特定のサイトにおける気温と露点温度の予報精度を大幅に向上させることができることを示した。また、SHAPを用いて機械学習モデルの予測メカニズムを解釈し、予報の信頼性を評価する手法を提案した。
要約
本研究では、数値気象予報モデルの出力を機械学習モデルで後処理することで、特定のサイトにおける気温と露点温度の予報精度を大幅に向上させることができることを示した。
まず、オーストラリアの11か所の観測地点における過去の数値予報データと観測データを用いて、XGBoostモデルを訓練した。モデルの入力には、予報地点の値に加えて周辺の格子点の値も使用することで、予報精度が大幅に向上した。
次に、SHAPを用いてモデルの予測メカニズムを解釈した。その結果、モデルの出力は主要な気象要素の線形結合と、時刻や風速などの非線形な要素による補正の組み合わせで表現できることがわかった。
さらに、モデルの信頼性を高めるため、特徴量の値が訓練データの範囲外にある場合の予報精度が低下することを発見し、そのような予報を自動的に検知する手法を提案した。この手法を適用したところ、特定の地点では予報誤差が平均の2倍にも達することがわかった。
以上の結果から、本研究で開発したフレームワークは、数値予報モデルの出力を大幅に改善し、かつ予報の信頼性も評価できるため、実用的な気象予報システムとして活用できると考えられる。
統計
予報誤差(RMSE)は、気温で最大0.38°C、露点温度で最大1.05°Cの改善が見られた。
重大な予報誤差(絶対誤差2°C以上)の割合は、気温で最大8.98%、露点温度で最大22.45%の削減が可能であった。
引用
"本研究では、XGBoostを用いて数値気象予報モデルの出力を後処理することで、特定のサイトにおける気温と露点温度の予報精度を大幅に向上させることができることを示した。"
"SHAPを用いて機械学習モデルの予測メカニズムを解釈した結果、モデルの出力は主要な気象要素の線形結合と、時刻や風速などの非線形な要素による補正の組み合わせで表現できることがわかった。"
"特徴量の値が訓練データの範囲外にある場合の予報精度が低下することを発見し、そのような予報を自動的に検知する手法を提案した。"