核心概念
此研究使用大型語言模型 (LLM),結合財務數據和新聞文章來預測股票價格走勢,並探討了不同模型、提示方法和預測時間段的影響。
參考文獻: Elahi, A., & Taghvaei, F. (2024). Combining Financial Data and News Articles for Stock Price Movement Prediction Using Large Language Models. arXiv preprint arXiv:2411.01368.
研究目標: 本研究旨在探討使用大型語言模型 (LLM) 結合財務數據和新聞文章預測股票價格走勢的可行性。
方法: 研究人員收集了 20 家交易量最高的公司股票的財務報告、歷史價格數據和新聞文章。他們使用檢索增強技術從新聞文章中提取相關信息,並將其與財務數據一起輸入預先訓練的 LLM(包括 GPT-3、GPT-4、LLaMA-2 和 LLaMA-3)中。模型在零、二和四種不同樣本學習設置下進行訓練,並使用加權 F1 分數和馬修斯相關係數評估其預測股票價格在未來三個月和六個月內漲跌的準確性。
主要發現: 研究結果表明,GPT 和 LLaMA3-8B 模型表現最佳,加權 F1 分數分別為 59.2% 和 59.1%。與六個月預測相比,三個月預測的準確性通常更高。增加樣本學習的樣本數量並沒有顯著提高模型的性能。
主要結論: LLM 在預測股票價格走勢方面具有潛力,尤其是在結合財務數據和新聞文章時。然而,選擇合適的模型和提示策略至關重要。
意義: 本研究為利用 LLM 進行金融預測提供了有價值的見解,並為未來開發更準確和可靠的股票價格預測模型奠定了基礎。
局限性和未來研究: 未來研究可以探索微調較小的語言模型以進一步提高性能。此外,預測未來回報的百分比變化(迴歸設置)也是一個值得關注的方向。
統計資料
測試樣本中 56.4% 和 70.1% 的股票在接下來的三個月和六個月內價格分別上漲。
三個月預測的最高加權 F1 分數為 0.592,由零樣本學習設置下的 GPT-3.5 模型實現。
六個月預測的最高加權 F1 分數為 0.591,由兩樣本學習設置下的 GPT-4 模型實現。