核心概念
LLMを使用した金融レポートの生成において、複合文の生成と創造性を高めつつ、幻覚を抑制する新しい2段階のファインチューニング手法を提案する。
要約
本研究では、金融レポートの生成における2つの主要な課題、すなわち複合文の欠如と幻覚の発生に取り組むため、新しい2段階のファインチューニング(FT)プロセスを提案している。
第1段階のFTでは、公開ドメインの金融レポートをプロンプト完了形式に変換し、単純なLLMプロンプトを使用して拡張する。これにより、LLMの自己学習機能を活用し、最初は幻覚を許容しつつ、その後の修正を通じて創造性を高めることができる。
第2段階のFTでは、第1段階で生成された幻覚的な文章を手動で修正し、LLMにその修正を学習させることで、幻覚を大幅に削減しつつ、複合文の生成と創造性を高めることができる。
提案する2段階FTフレームワークにより、正解率が2倍に増加し、幻覚が50%以上減少した。さらに、2段階FTモデルはperplexity、ROUGE、TER、BLEUスコアが向上し、不確実性とクロスエントロピーが低下した。これにより、ドメイン固有のFTタスクを最小限のコストで一般化できる。
統計
2段階FTモデルは、単一段階FTモデルと比べて正解率が2倍に増加した。
2段階FTモデルは、幻覚を50%以上削減した。
2段階FTモデルのperplexity、ROUGE、TER、BLEUスコアが向上し、不確実性とクロスエントロピーが低下した。
引用
"LLMの自己学習機能を活用し、最初は幻覚を許容しつつ、その後の修正を通じて創造性を高めることができる。"
"提案する2段階FTフレームワークにより、正解率が2倍に増加し、幻覚が50%以上減少した。"