Kernkonzepte
時間序列預測(TSF)正經歷著模型架構多元化的復興,從傳統統計方法和機器學習到深度學習(如 MLP、CNN、RNN、GNN 和 Transformer),以及更新的混合模型、擴散模型、Mamba 模型和基礎模型,展現出不斷演進的趨勢,同時也面臨著通道依賴性、分佈偏移、因果關係和特徵提取等開放性挑戰。
Zusammenfassung
時間序列預測綜述:架構演進與開放性挑戰
這篇綜述論文全面概述了時間序列預測(TSF)領域的發展歷程,重點關注模型架構多元化趨勢和現存的開放性挑戰。
時間序列預測的演進
TSF 模型經歷了從傳統統計方法到機器學習,再到深度學習的演變過程:
- 傳統統計方法: 早期以移動平均為基礎的統計模型,如指數平滑和 ARIMA 模型,奠定了序列數據分析的基礎。這些方法簡單直觀,適用於識別數據中的基本模式。
- 機器學習模型: 決策樹、支持向量機(SVM)和梯度提升機(GBM)等機器學習模型克服了統計方法的局限性,能夠直接從數據中學習非線性模式,展現出更強的預測能力。
- 深度學習模型: 隨著數據量和計算能力的提升,多層感知器(MLP)、循環神經網絡(RNN)、卷積神經網絡(CNN)和圖神經網絡(GNN)等深度學習架構被應用於 TSF,能夠學習更複雜的模式。
- RNN 及其變體: RNN 擅長處理序列數據,但早期 RNN 存在梯度消失和難以並行處理等問題。長短期記憶網絡(LSTM)和門控循環單元(GRU)的出現有效解決了梯度消失問題,推動了基於 RNN 的 TSF 模型的蓬勃發展。
- CNN 的應用: CNN 最初主要用於圖像數據,但一維 CNN 和時間卷積網絡(TCN)的發展展現了其在時間序列數據分析方面的潛力,能夠有效提取局部模式和長期依賴關係。
- GNN 的興起: GNN 擅長處理圖結構數據,逐漸被應用於分析多變量時間序列數據中複雜的結構關係,例如交通預測和社交網絡分析。
- Transformer 模型: Transformer 模型以其處理長期依賴關係的能力著稱,已成為 TSF 的重要架構組成部分。
- 架構多元化: 近期研究表明,簡單線性模型在某些情況下可以超越 Transformer 模型,促使人們重新審視傳統深度學習方法,並對混合模型、擴散模型、Mamba 模型和基礎模型等各種架構產生了濃厚興趣。
開放性挑戰與解決方案
儘管先進的架構解決了許多問題,但 TSF 領域的核心挑戰依然存在:
- 通道依賴性: 多變量時間序列數據中各個變量之間的相關性。
- 解決方案:通道相關性理解(CI)和通道解耦(CD)策略。
- 分佈偏移: 時間序列數據的統計特性隨時間推移而發生變化。
- 因果關係: 識別時間序列數據中變量之間的因果關係。
- 特徵提取: 從時間序列數據中提取有意義的特徵。
總結
TSF 領域正處於模型架構多元化的復興階段,各種方法相互競爭,共同推動著該領域的發展。未來的研究方向包括開發更強大的模型,以應對上述開放性挑戰,並探索 TSF 在更多領域的應用。
Statistiken
圖2展示了時間序列預測論文在頂級人工智能和機器學習會議上的接收數量呈爆炸式增長。
表1總結了關於時間序列預測的綜述論文,涵蓋了從傳統方法到深度學習的各個方面。
表2列出了時間序列預測模型常用的數據集,涵蓋了能源消耗、交通、天氣、匯率和疾病爆發等多個領域。
表3詳細介紹了 Monash 時間序列預測檔案庫中的數據集,涵蓋了更廣泛的領域,例如能源、經濟、自然和銷售。
表4按類型對時間序列預測的評估指標進行了分類,並解釋了每個指標的含義和計算方法。
Zitate
"TSF has entered a renaissance of modeling, with various methodologies actively competing without being dominated by any single approach."
"Time series data lack the well-designed vocabulary and grammar found in NLP, and obtaining vast amounts of data is more difficult than in fields like Computer Vision(CV) or NLP."
"The distinct characteristics of time series data necessitate the use of diverse metrics in TSF."