核心概念
グラフニューラルネットワークと説明可能性手法を用いて、気象観測データが大気状態推定に及ぼす影響を定量的に評価し、可視化する。
要約
本研究では、気象観測データと数値気象予報(NWP)グリッドポイントを統合したメテオロジカルグラフを定義し、自己教師あり学習を用いてグラフニューラルネットワーク(GNN)モデルを構築しました。このモデルは、k-hop近傍のサブグラフを利用して、NWPグリッドポイントの大気状態を推定します。
さらに、勾配ベースの説明可能性手法を適用し、各観測データの推定プロセスにおける重要度を定量化しました。11種類の衛星および地上観測データを用いた評価結果から、観測データ種類の重要度を可視化することで、気象予報におけるデータ利用の理解と最適化が可能であることが示されました。
具体的には以下の通りです:
メテオロジカルグラフの構築: 観測点とNWPグリッドポイントをノードとし、50km圏内の隣接性に基づいて辺を定義
自己教師あり学習: ノード属性の再構成タスクによりノード表現を学習
大気状態推定: GCNによるサブグラフ表現の学習と、MLPによる大気状態の推定
観測データの影響分析: 勾配ベースの説明可能性手法(SA、Grad-CAM、LRP)を適用し、観測データの重要度を定量化
提案モデルは、従来の全結合ネットワークや他のGNN手法と比較して、大気状態推定の精度が大幅に向上しました。また、LRP手法が最も高いフィデリティを示し、観測データの重要度を適切に捉えていることが確認されました。
統計
大気状態推定の平均二乗誤差(RMSE)は、u成分で0.16 m/s、v成分で0.09 m/s、気温で0.19 K、比湿で0.03 kg/kg
大気状態推定の決定係数(R2)は、u成分で0.73、v成分で0.73、気温で0.93、比湿で0.64