核心概念
本稿では、従来のアナリストによる評価よりも正確な株式格付けを、大規模言語モデルを用いて生成できる可能性を示唆している。
要約
大規模言語モデルを用いた株式格付け:AI投資分析における新たな可能性
本稿は、金融サービス業界における投資分析において、大規模言語モデル(LLM)を用いた株式格付けの可能性を探求した研究論文である。
研究目的
- 従来の株式格付け手法の限界を克服し、LLMを用いることで、より正確で一貫性のある株式格付けを生成できるかを検証する。
- 金融分野におけるLLMの有効性を評価し、予測能力を高めるデータソースを特定する。
方法
- 2022年1月から2024年6月までのS&P 500構成銘柄のデータを用い、GPT-4-32k (v0613) を活用。
- ファンダメンタルズデータ、市場データ、ニュースデータ(要約およびセンチメントスコア)など、様々なデータセットをLLMに入力。
- 1ヶ月、3ヶ月、6ヶ月、12ヶ月、18ヶ月後のフォワードリターンに基づき、生成された株式格付けの精度を評価。
- 従来のアナリストによる格付けとLLMによる格付けの精度を比較。
結果
- 基本的な財務指標のみを用いたVanilla LLMモデルは、フォワードリターンで評価した場合、従来のアナリストの評価よりも高いパフォーマンスを示した。
- ファンダメンタルズデータを用いたLLMは、他のすべての実験を上回るパフォーマンスを示し、財務ファンダメンタルズが予測精度に大きく影響することがわかった。また、ニュース要約ではなく、センチメントスコアを組み合わせることで、予測精度がさらに向上した。
- ニュース要約とセンチメント分析を統合すると、短期的な予測には有効であるが、Vanillaモデルと比較して長期的な予測精度は大幅に向上しない。
- ニュースをテキストとして追加した場合と、ニュースのセンチメントをLLMに追加した場合のパフォーマンスの違いは、他のデータ(ファンダメンタルズなど)が含まれていない場合は非常に小さく、どちらのアプローチも同様の利点があることを示している。
- LLMは短期的な予測においてより優れたパフォーマンスを発揮するため、短期的な企業予測におけるLLMの能力をさらに探求する必要がある。
- ニュース要約は短期的な予測に有効だが、従来のアナリストは長期的な予測において優れたパフォーマンスを発揮する。
結論
本研究は、株式格付けという金融分野における新しい応用において、LLMが正確で解釈可能な予測を提供できる可能性を示している。今後の研究では、より長期的なコンテキストを提供するために、より長い期間のニュース要約を用い、要約の期間を延長することに焦点を当てる。また、短期的な予測におけるLLMの能力をさらに探求し、長期的な予測能力を高める戦略を開発する。
統計
モルガン・スタンレー、バークレイズ、ウェルズ・ファーゴ、シティグループ、RBCキャピタルの上位5社が、全格付けの31.61%を占めている。
アナリストによる格付けのうち、75.90%が維持、7.25%が反復、6.27%が格下げ、5.68%が格上げ、4.89%が開始であった。
1ヶ月あたり平均39.63件の記事、187K文字、40Kトークン、74.70件のURL、34.40件の欠損記事がある。