核心概念
本稿では、企業の年次報告書(Form 10-K)のテキストデータのみを用いて、中小規模のニューラル言語モデルが長期的な株価の動きを予測できることを示している。
要約
ニューラル言語モデルを用いた長期的な株式「買い」シグナルの生成
本稿は、S&P 500 企業の年次報告書(Form 10-K)のテキストデータを用いて、将来の株価の動きを予測する研究について記述した研究論文である。
本研究は、企業の年次報告書(Form 10-K)のテキストデータを用いて、中小規模のニューラル言語モデルで長期的な株価の動きを予測できるかを検証することを目的とする。
S&P 500 企業の 2015 年から 2024 年までの Form 10-K レポートを収集し、リスク要因、法的措置、経営陣による財務状況および業績の分析(MD&A)、市場リスクに関する定量的および定性的開示といった主要セクションのテキストデータを抽出。
収集したテキストデータを用いて、中小規模のニューラル言語モデルをファインチューニングし、レポート提出後 3 ヶ月、6 ヶ月、9 ヶ月、12 ヶ月後の株価の向き(上昇または下落)を予測するモデルを構築。
モデルの予測精度を評価するために、F1 スコア、適合率、再現率などの統計指標を用いて、ランダムな株式選択モデルと比較。