核心概念
本文提出了一種名為檢索增強時間序列擴散模型 (RATD) 的新型時間序列預測框架,旨在解決現有擴散模型在預測性能方面的局限性。
摘要
論文概述
本論文介紹了一種名為檢索增強時間序列擴散模型 (RATD) 的新型時間序列預測方法。RATD 旨在解決現有時間序列擴散模型在處理複雜預測任務時性能不穩定和缺乏指導的問題。
研究背景
時間序列預測在天氣預報、金融預測和能源規劃等各個領域都發揮著至關重要的作用。擴散模型作為一種最新的條件生成模型,已在許多時間序列預測任務中得到應用。然而,現有的時間序列擴散模型存在一些局限性:
- 缺乏有意義的指導:與圖像擴散模型不同,時間序列數據通常缺乏直接的語義或標籤對應,導致生成過程中缺乏有意義的指導。
- 數據集規模不足和不平衡:與龐大的圖像數據集相比,時間序列數據集通常規模較小,且存在顯著的不平衡現象,這使得模型難以學習數據集的精確分佈,並容易忽視一些極其罕見的複雜樣本。
研究方法
RATD 提出一種兩階段框架來解決上述問題:
- 基於嵌入的檢索機制: 首先從數據庫中檢索與歷史時間序列最相關的時間序列作為參考。具體而言,使用預先訓練的編碼器將時間序列轉換為嵌入向量,並根據嵌入向量之間的距離進行檢索。
- 參考引導的擴散模型: 在反向擴散過程中,利用檢索到的參考樣本作為指導信息,以提高生成預測的準確性。論文提出了一種名為參考調製注意力 (RMA) 的新型模塊,用於有效地整合當前時間序列特徵、邊緣特徵和參考特徵。
實驗結果
論文在四個公開時間序列數據集 (Electricity、Wind、Exchange、Weather) 和一個大型心電圖時間序列數據集 (MIMIC-IV-ECG) 上進行了實驗。實驗結果表明,RATD 在多個指標上均優於現有的時間序列擴散模型和其他時間序列預測方法,尤其是在處理複雜預測任務方面表現出色。
論文貢獻
- 首次將檢索增強機制引入時間序列擴散模型,以提高數據集利用率並為去噪過程提供有意義的指導。
- 設計了參考調製注意力 (RMA) 模塊,用於有效地整合參考信息,而不會引入過多的計算成本。
- 在五個真實世界數據集上進行了實驗,並使用多個指標對結果進行了全面展示和分析。
局限性和未來方向
- 作為一種基於 Transformer 的擴散模型結構,RATD 在處理包含大量變量的時間序列時仍面臨著計算資源消耗大的挑戰。
- RATD 在訓練過程中需要額外的預處理(檢索過程),這會增加訓練時間。
總結
RATD 是一種新穎且有效的时间序列预测框架,它通过检索增
統計資料
LAION-400M 圖像數據集包含 4 億個樣本對。
MIMIC-IV 心電圖數據集中,與診斷出的預激綜合徵 (PS) 相關的記錄佔總記錄的不到 0.025%。
实验中,历史时间序列的长度为 168,预测长度分别为 96、192 和 336。
实验在配备 40GB 内存的 Nvidia RTX A6000 GPU 上进行。
检索数据库中每个类别的样本数量 (n) 设置为 256。
参考样本的数量 (k) 设置为 3。
引述
"The retrieval-augmented mechanism is one of the classic mechanisms for generative models."
"This advantage stems from the iterative structure of the diffusion model, where references can repeatedly influence the generation process, allowing references to exert a stronger influence on the entire conditional generation process."