Основные понятия
本文提出了一種名為 FACTS 的全自動時間序列預測框架,該框架能夠在幾分鐘內高效準確地預測相關時間序列的未來值。
引言
許多重要的社會和工業基礎設施,包括智能交通系統、電網、患者監測系統和工業控制系統,都涉及記錄隨時間變化值的傳感器,從而產生多個通常相互關聯的時間序列,稱為相關時間序列 (CTS)。
基於歷史值預測此類時間序列的未來值具有重要的應用。
採用深度學習的方法在 CTS 預測方面取得了最先進的性能。
大多數模型架構都是由人類專家手動設計的,其核心組件是時空塊 (ST-blocks),這些塊由空間/時間 (S/T) 運算符(例如卷積、圖卷積和變換器)構成,並捕獲歷史值之間的時間依賴性和時間序列之間的空間相關性。
儘管取得了可喜的成果,但即使是人類專家也很難為新任務設計最佳的 ST-blocks。
自動化 CTS 預測
自動化 CTS 預測旨在自動識別不同任務的最佳 ST-blocks,然後使用它們進行預測。
它包括三個階段:搜索空間設計、搜索最佳 ST-block 以及訓練識別的 ST-block。
首先設計一個搜索空間,它是由 S/T 運算符和用於組裝運算符的拓撲連接規則組成的一組 ST-blocks。
接下來,他們採用基於梯度、基於比較器或隨機搜索等搜索策略來探索搜索空間,以找到給定任務的最佳 ST-block。
最後,對識別出的 ST-block 進行訓練,以實現預測任務。
現有自動化方法的局限性
手動設計的搜索空間:搜索空間仍然是手動設計的,這可能會導致性能欠佳,並且也違反了 AutoML 的目標,即自動化整個過程。
高搜索成本:現有的自動化方法採用基於梯度、基於比較器或隨機搜索等搜索策略來探索搜索空間以找到最佳 ST-block,這些策略都非常耗時。
高訓練成本:找到高性能的 ST-block 後,現有方法會針對未見過的 CTS 預測任務從頭開始對其進行訓練,這通常需要數小時,具體取決於任務的規模。
FACTS 框架
FACTS 是一個全自動且高效的 CTS 預測框架,旨在解決現有自動化方法的局限性。
它包括一個自動剪枝策略、一個高效的零樣本搜索策略和一個快速參數適應策略。
自動搜索空間剪枝
FACTS 提出了一種自動化策略,將通用搜索空間剪枝為適用於特定 CTS 預測任務的高質量且相對較小的搜索空間。
它首先將通用搜索空間劃分為質量可區分的子空間,然後迭代地移除質量較低的子空間。
搜索空間劃分基於這樣一個觀察結果,即 S/T 運算符的組合在很大程度上決定了它們組成的 ST-blocks 的準確性,從而導致不同的組合在質量上可區分,其中組合的質量是指其中 ST-blocks 的整體性能,並使用 EDF(錯誤經驗分佈函數)進行衡量。
FACTS 採用迭代搜索空間剪枝策略,逐步減小 EDF 閾值,以解決單次剪枝可能導致移除高質量子空間的問題。
零樣本搜索
FACTS 在眾多不同的 CTS 預測任務上預訓練一個任務感知架構預測器 (TAP),然後對未見過的任務執行零樣本搜索,以在幾分鐘內找到最佳的 ST-blocks。
TAP 由架構特徵學習 (AFL) 模塊、任務特徵學習 (TFL) 模塊和 MLP 迴歸器組成。
AFL 提取 ST-block 架構的特徵,將其視為有向無環圖 (DAG),並使用圖卷積網絡 (GCN) 和單層 MLP 對其進行編碼。
TFL 提取 CTS 預測任務的特徵,考慮語義特徵和統計特徵,使用兩層 Set-Transformer 提取任務的語義特徵向量,並使用 tsfresh 提取統計特徵以構建統計特徵向量。
在預訓練階段,FACTS 迭代地收集訓練樣本,並在搜索空間剪枝過程中逐步從剪枝後的高質量搜索空間中收集訓練樣本,以便 TAP 對搜索空間的高質量區域具有更準確的預測能力。
在零樣本搜索階段,FACTS 首先對未見過的任務執行自動搜索空間剪枝,使用預訓練的 TAP 生成的偽 EDF 替換真實 EDF。剪枝完成後,使用預訓練的 TAP 預測剪枝後的搜索空間中所有 ST-blocks 在未見過的任務上的準確性,並返回預測性能最佳的 ST-block 作為最佳 ST-block。
使用參數適應進行快速訓練
找到高性能的 ST-block 後,FACTS 會訓練其參數權重,以便對未見過的任務進行預測。
與將不同 ST-blocks 的訓練視為獨立過程並從頭開始訓練識別出的 ST-block 的現有自動化方法不同,FACTS 繼承了預訓練 ST-blocks 的參數權重,以加速識別出的 ST-block 的訓練。
它提出了一種快速參數適應策略,以可學習的方式繼承預訓練 ST-blocks 的權重,然後在目標任務上微調繼承的權重,以獲得識別出的 ST-block 的最佳權重。
總結
FACTS 是一個全自動且高效的 CTS 預測框架,它解決了現有自動化方法的局限性。
它包括一個自動剪枝策略、一個高效的零樣本搜索策略和一個快速參數適應策略。
實驗結果表明,FACTS 能夠在保持高效率的同時,在未見過的 CTS 預測任務上實現最先進的預測精度。