Основные понятия
大規模言語モデルの出力を、関連する過去の事例を提供することで改善できる。これにより、生成された回答の正確性と妥当性が向上する。
Аннотация
本研究では、ケースベース推論(CBR)の手法を用いて、大規模言語モデル(LLM)の検索拡張型生成(RAG)を強化する手法を提案している。
- CBRの初期検索段階、インデックス語彙、類似性知識コンテナを活用し、LLMクエリに関連する過去事例を提供することで、より豊かなプロンプトを生成する。
- 一般的な言語モデルと法分野特化モデルの異なる表現形式(内部表現と外部表現)を比較し、ハイブリッド的な重み付け検索手法の有効性を示す。
- 法的質問応答タスクにおいて、CBR-RAGの手法が生成された回答の質を大幅に向上させることを実証する。
Статистика
事例ベースには2,084件の法的質問-回答-根拠テキストのトリプレットが含まれている。
事例ベース内で最も頻出する法律は「連邦裁判所規則」で、785件の事例に登場している。
事例の57%には法律の言及がなく、単純な法律インデックスでは不十分であることが分かる。
Цитаты
"CBRは、RAGモデルにおける検索プロセスを強化する優れた機会を提供する。過去の解決策がエビデンスとなる知識ベースを形成できるためである。"
"CBR-RAGシステムは知識依存型の生成タスクに大きな可能性を秘めている。"