核心概念
本研究は、GPT-4 Omniを活用して合成データを生成し、FinBERTモデルの性能を向上させ、その知識を蒸留することで、計算効率の高いTinyFinBERTモデルを開発することを目的としている。
要約
本研究は、金融感情分析の高度化に向けて以下の取り組みを行っている:
GPT-4 Omniを使用して金融ドメイン特有の合成データを生成し、FinBERTモデルの性能を向上させる。
強化されたFinBERTモデルから知識蒸留を行い、計算効率の高いTinyFinBERTモデルを開発する。
TinyFinBERTモデルの性能を、FinBERTおよび他のベースラインモデルと比較評価する。
TinyFinBERTモデルの一般化性能を、未知のデータセットでも検証する。
これらの取り組みにより、金融感情分析の高精度化と効率的な実装を両立することが期待される。
統計
GPT-4 Omniを使用して生成した新規トレーニング例のラベル分布は、ポジティブ:40.2%、ネガティブ:35.4%、ニュートラル:24.4%であった。
GPT-4 Omniを使用して生成した誤ラベル文の変形例のラベル分布は、ポジティブ:35.6%、ネガティブ:37.2%、ニュートラル:27.2%であった。
GPT-3.5 Turboを使用して生成した新規無ラベル例のラベル分布は、ポジティブ:33.8%、ネガティブ:36.4%、ニュートラル:29.8%であった。