核心概念
本文介紹了一種名為 MEANT 的新型多模態編碼器模型,該模型專為處理時間序列數據而設計,並在股票市場預測任務中展現出卓越的性能。
摘要
論文資訊
- 標題:MEANT:一種用於處理先前資訊的多模態編碼器
- 作者:Benjamin Iyoya Irving∗, Annika Marie Schoene
- 機構:美國麻薩諸塞州波士頓東北大學
研究目標
本研究旨在開發一種能夠有效處理多模態時間序列數據的模型,並應用於股票市場預測任務,特別是預測股票價格的動量變化。
方法
- 本文提出了一種名為 MEANT 的新型多模態編碼器模型,該模型結合了圖像和語言處理的優勢,並採用一種新穎的時間注意力機制來提取多模態序列資訊中的依賴關係。
- MEANT 模型採用編碼器-解碼器架構,其中語言編碼器使用 FinBERT tokenizer 和預先訓練的詞嵌入層來處理文本數據,而圖像編碼器則使用 TimeSFormer 架構來提取圖像特徵。
- 為了處理時間資訊,MEANT 模型採用一種稱為「查詢目標」的策略,其中注意力機制的查詢矩陣僅從目標日(即預測日)生成,以強調目標日與先前交易日之間的關係。
主要發現
- 在 TempStock 數據集上,MEANT-XL 模型在 F1 分數、精確率和召回率方面均優於所有其他模型,包括 TEANet、LSTM 和 MLP 基線模型。
- 在 StockNet 數據集上,MEANT-Tweet-price 模型的表現也優於其他模型,包括 TEANet 和 StockNet 模型,準確率提高了 15%。
主要結論
- MEANT 模型在處理多模態時間序列數據方面非常有效,並且在股票市場預測任務中取得了最先進的結果。
- 時間注意力機制對於從時間序列數據中提取有意義的關係至關重要。
- 多模態資訊,特別是文本數據,可以顯著提高股票市場預測的準確性。
意義
本研究提出了一種新穎的多模態時間序列分析模型,並證明了其在金融領域的有效性。該模型可以應用於其他領域,例如醫療保健、交通和社交媒體分析。
局限性和未來研究方向
- TempStock 數據集的規模相對較小,並且僅限於特定時間段和股票市場。未來研究可以收集更大、更多樣化的數據集來進一步驗證 MEANT 模型的性能。
- MEANT 模型的訓練目標是識別買入和賣出信號,而不是預測更細微的價格變化。未來研究可以探索更精確的預測目標。
- 未來研究可以探索不同的早期融合方法,以使 MEANT 模型對其他常見的多模態基準測試更加穩健,並擴展查詢目標策略,以自動強調相關查詢,而不是手動強調任何特定組件,例如最後一個滯後日。
統計資料
MEANT-XL 模型在 TempStock 數據集上的 F1 分數達到 0.8440。
MEANT-Tweet-price 模型在 StockNet 數據集上的準確率達到 82.15%,比先前最先進的 TEANet 模型提高了 15%。
TempStock 數據集包含超過 175 萬條推文和標準普爾 500 指數中所有公司的價格資訊,涵蓋時間從 2022 年 4 月 10 日到 2023 年 4 月 10 日。
引述
"MEANT combines the advantages of image and language processing with temporal attention, in order to extract dependencies from multimodal, sequential information."
"To our knowledge, MEANT-XL is the largest model to be applied to StockNet, and is the first multimodal model to contain an attention mechanism to deal with data over a lag period of days."