核心概念
大規模言語モデルの特性を活用し、金融分野の知識ベースに適応した高精度な質問意図分類モデルConFIRMを提案する。
要約
本研究では、金融分野の対話システムに適用可能な質問意図分類モデルConFIRMを提案している。
ConFIRMの主な特徴は以下の通り:
大規模言語モデルを活用し、金融分野の知識ベースに特化したQA対話データを合成する手法を開発した。
金融分野の知識ベースに対する質問意図分類タスクに、パラメータ効率の高いファインチューニング手法を適用し、90%を超える高精度を実現した。
金融分野の規制に準拠するため、内部/外部の知識ベースラベルの正確性も評価している。
合成QAデータの生成プロセスでは、大規模言語モデルを活用し、金融分野の特徴的な質問を効率的に生成している。また、パーソナリティ特性を付与することで、より自然な対話形式を実現している。
分類タスクでは、LoRAと呼ばれるパラメータ効率の高いファインチューニング手法が最も優れた性能を示した。これにより、元の言語モデルの0.031%のパラメータ数で90%を超える高精度を達成している。
本研究の成果は、金融分野における対話システムの高度化に貢献するものと期待される。今後は、より包括的な情報検索プロセスの統合や、より大規模な言語モデルの活用などに取り組む予定である。
統計
金融データ透明性法(FDTA)により、金融規制当局に報告される情報は電子的に検索可能でなければならない。
株式保有率は61%と報告されており、株式投資が一般消費者に広く普及している。
ConFIRMモデルは、内部/外部の知識ベースラベルの正確性が91.1%に達した。
引用
"大規模言語モデルの特性を活用し、金融分野の知識ベースに適応した高精度な質問意図分類モデルConFIRMを提案する。"
"LoRAと呼ばれるパラメータ効率の高いファインチューニング手法が最も優れた性能を示し、元の言語モデルの0.031%のパラメータ数で90%を超える高精度を達成している。"