核心概念
運用機器學習模型和公開數據,分析西班牙地區風暴的經濟損失,以增強災害應變能力,並為決策者提供制定防災減災策略的依據。
摘要
書目資訊
Pedra, M. P., Hernantes, J., Casals, L., & Labaka, L. (2024). Windstorm Economic Impacts on the Spanish Resilience: A Machine Learning Real-Data Approach.
研究目標
本研究旨在探討機器學習模型在強化災害應變管理方面的關鍵作用,利用公開數據分析風暴事件、西班牙地區的地理和社會經濟特徵,預測風暴造成的經濟損失等級。
研究方法
- 資料收集:從西班牙保險賠償聯盟 (CCS) 和西班牙國家氣象局 (AEMET) 收集 2013 年至 2022 年十年間,造成巨額經濟損失的 204 起風暴災害事件數據,包括災害事件發生情況、氣象特徵和相關的韌性特徵。韌性特徵採用了基準韌性指標 (BRIC) 架構,涵蓋社會、經濟、基礎設施和環境等面向的數據。
- 資料預處理:使用 Open Refine 工具清理數據,整合和調整最終特徵,並根據經濟損失的四分位數分析,選擇造成巨額經濟損失的事件,將經濟損失分為三個等級:中度(Level 1)、嚴重(Level 2)和災難性(Level 3)。
- 模型建立:採用隨機森林分類器 (RFC) 模型,並透過 Python 的 Scikit-learn 函式庫進行模型訓練和測試。
- 效能評估:使用準確率、召回率和 F1 分數等指標評估模型的預測效能。
主要發現
- 影響模型結果最顯著的特徵是風暴事件中受影響系統的數量,其次是最大風速和外國人口比例。
- 在韌性概念方面,基礎設施韌性方面影響最大的是受影響系統的數量,社會韌性方面則是外國人口比例,經濟韌性方面是失業率,環境韌性方面是總面積。
- 模型結果顯示,失業率比就業率更能預測經濟損失等級,平均薪資比人均 GDP 更具影響力。
主要結論
- 機器學習模型,特別是隨機森林分類器,可以有效地利用風暴災害事件、氣象和社會經濟變數,對不同類型的災害造成的經濟損失進行分類和預測。
- 透過分析模型特徵的重要性,可以發現氣象變數是影響經濟損失等級的主要因素,而韌性指標,特別是社會、經濟、基礎設施和環境等面向,對於理解和增強一個地區的韌性至關重要。
研究意義
本研究為城市管理者提供了一個基於數據驅動的方法,用於災害應變管理和增強社會韌性,提升災害的準備、應變和恢復能力。
研究限制和未來方向
- 本研究使用的數據來自保險公司,可能未涵蓋未投保的損失。
- 未來研究可以納入更多特徵類別的數據,以加強 BRIC 韌性子域的分析,並進行預測以估計未來風暴可能造成的經濟損失。
- 可以整合可解釋的人工智慧模型,幫助城市管理者和利益相關者理解模型的預測結果。
統計資料
分析了西班牙保險賠償聯盟 (CCS) 十年期間(2013 年至 2022 年)的 204 起風暴災害事件數據。
這些事件造成巨額經濟損失,屬於經濟損失四分位數的第四分位數。
第四分位數的平均經濟損失為 851,468.14 歐元,範圍從 45,076 歐元到 19,298,377 歐元。
根據經濟損失的程度,將數據分為三個等級:中度(Level 1)、嚴重(Level 2)和災難性(Level 3)。
模型的準確率達到 0.823,召回率和 F1 分數達到 0.82。