本研究では、金融レポートの生成における2つの主要な課題、すなわち複合文の欠如と幻覚の発生に取り組むため、新しい2段階のファインチューニング(FT)プロセスを提案している。
第1段階のFTでは、公開ドメインの金融レポートをプロンプト完了形式に変換し、単純なLLMプロンプトを使用して拡張する。これにより、LLMの自己学習機能を活用し、最初は幻覚を許容しつつ、その後の修正を通じて創造性を高めることができる。
第2段階のFTでは、第1段階で生成された幻覚的な文章を手動で修正し、LLMにその修正を学習させることで、幻覚を大幅に削減しつつ、複合文の生成と創造性を高めることができる。
提案する2段階FTフレームワークにより、正解率が2倍に増加し、幻覚が50%以上減少した。さらに、2段階FTモデルはperplexity、ROUGE、TER、BLEUスコアが向上し、不確実性とクロスエントロピーが低下した。これにより、ドメイン固有のFTタスクを最小限のコストで一般化できる。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Sohini Roych... at arxiv.org 09-20-2024
https://arxiv.org/pdf/2408.05365.pdfDeeper Inquiries