核心概念
簡單的線性統計模型,尤其是在加入新穎的協同移動指標後,在預測年度颶風數量方面,能提供與複雜機器學習模型相當甚至更優異的預測準確度。
摘要
書目資訊
Colombo, P., Mattera, R., & Otto, P. (2024). Simple yet effective: a comparative study of statistical models for yearly hurricane forecasting. arXiv preprint arXiv:2411.11112.
研究目標
本研究旨在比較不同統計模型於預測大西洋年度颶風數量之成效,並探討簡單線性模型是否足以提供可靠的預測結果。
研究方法
- 收集 1981 年至 2022 年的大西洋年度颶風數量數據,以及一系列潛在的氣候預測指標。
- 透過逐步迴歸分析,選取與颶風數量顯著相關的預測變數,包括拉尼娜指數的滯後標準差和 500 毫巴高度的緯向平均溫度異常。
- 建立一個名為「虛擬預測指標」(PP) 的新指標,用於捕捉異常年份的颶風數量變化。
- 比較四種類型的預測模型:時間序列模型 (ARIMA)、計數時間序列模型 (INGARCH)、機率預測模型 (分位數迴歸和分位數梯度提升迴歸樹) 和機器學習模型 (LSTM)。
- 採用滾動窗口方法進行模型訓練和預測,並使用三個指標評估模型的預測準確度:平均絕對誤差 (MAE)、方向準確度 (DA) 和平均分位數損失函數 (APLF)。
主要發現
- 在未加入 PP 指標的情況下,分位數迴歸模型的點預測準確度最高 (MAE = 1.96),其次是 INGARCH 模型 (MAE = 1.99)。
- 加入 PP 指標後,所有模型的預測準確度均顯著提高,其中以分位數迴歸模型的改善幅度最大 (MAE 從 1.96 降至 1.41)。
- 簡單的線性模型,尤其是在加入 PP 指標後,在預測準確度方面與複雜的機器學習模型 (如 LSTM) 相當甚至更優異。
- 分位數迴歸模型能提供有關預測不確定性的有用資訊,例如在 2013 年和 2020 年的極端分位數預測結果,準確地反映了模型高估和低估的趨勢。
主要結論
- 簡單的線性統計模型,尤其是在加入新穎的協同移動指標後,在預測年度颶風數量方面,能提供與複雜機器學習模型相當甚至更優異的預測準確度。
- 機率預測方法,例如分位數迴歸,能提供有關預測不確定性的寶貴資訊,有助於更全面地評估風險。
研究意義
本研究結果強調了簡單、可解釋的模型在預測複雜環境現象方面的價值,並提供了一種新穎的協同移動指標,可顯著提高預測準確度。
研究限制與未來方向
- 未來研究可探討其他潛在的預測變數,並進一步優化 PP 指標的建構方法。
- 此外,可以進一步研究如何將機率預測結果應用於實際的決策過程中,例如颶風風險管理和防災準備。
統計資料
1997 年、2013 年和 2020 年的颶風數量與往年相比出現異常。
ESPI 指數與年度颶風發生次數呈負相關,相關係數為 -0.48%。
PP 指標與年度颶風發生次數呈負相關,相關係數為 -0.86%。
分位數迴歸模型在未加入 PP 指標時的 MAE 為 1.96,加入 PP 指標後降至 1.41。
QGBRT 模型在未加入 PP 指標時的 MAE 為 3.25,加入 PP 指標後降至 1.58。
2015 年,分位數迴歸模型加入 PP 指標後的 PIT 值為 0.43。
2020 年,分位數迴歸模型加入 PP 指標後的 PIT 值為 0.86。