核心概念
本稿では、財務データとニュース記事を組み合わせ、事前学習済み大規模言語モデル(LLM)を用いることで、株価動向を予測する手法を提案する。
要約
金融データとニュース記事を組み合わせた、大規模言語モデルを用いた株価動向予測
本論文は、大規模言語モデル(LLM)を用いて、財務データとニュース記事を組み合わせて株価動向を予測する新しい手法を提案している。従来の株価予測モデルは、主に数値データに依存していたが、本研究では、企業業績、市場動向、投資家心理に影響を与える可能性のあるニュース記事などのテキストデータの重要性を強調している。
データ収集: 取引量の多い20社の企業の、2021年から現在までの財務データとニュース記事を収集した。財務データは10-K報告書から、ニュース記事は様々なオンラインソースから取得した。
データ前処理: ニュース記事は、関連性の高い情報を含む短いチャンクに分割され、OpenAIの埋め込みを用いて要約された。財務データは、過去4四半期の収益、純利益、フリーキャッシュフロー、総資産などの主要な指標に整理された。
プロンプト生成: LLMへのプロンプトは、企業に関する一般的な情報、関連するニュース記事のチャンク、過去4四半期の財務データ、そして予測対象となる日付を含むように設計された。
LLMを用いた予測: MetaのLLaMA2、LLaMA3、OpenAIのGPT-3.5、GPT-4など、様々な事前学習済みLLMを用いて、株価が上昇するか下落するかを予測した。
評価: モデルの性能は、加重F1スコアとマシューズ相関係数を用いて評価された。