核心概念
中間ステップのデータが利用できない状況でも、自己生成したサンプルを活用して中間ステップと最終応答の生成性能を向上させる。
摘要
本論文では、知識ベースの対話システムにおいて、中間ステップ(例:Web検索、メモリ検索)のデータが利用できない状況でも、自己生成したサンプルを活用して中間ステップと最終応答の生成性能を向上させる手法を提案している。
具体的には以下の手順で行う:
- 入力文脈に対して、中間ステップ(検索クエリ生成、検索知識生成、エンティティ知識生成)と最終応答を生成する。
- 生成した応答が正解と一致しない場合、過去の不適切な応答を集めたガイドプロンプトを入力に追加し、再度応答を生成する。
- 正解と一致した応答をブートストラップデータとして蓄積し、モデルを fine-tuning する。
- 上記の手順を繰り返し行うことで、中間ステップと最終応答の生成性能を段階的に向上させる。
提案手法は、知識ベースの対話タスク(質問応答、知識ベース対話、オープンドメイン対話、タスク指向対話)において、既存手法を上回る性能を示した。特に、中間ステップの生成性能が向上したことで、最終応答の正確性と多様性が向上した。
統計資料
緑海亀は世界140か国以上に生息し、産卵地は80か国にある。
ベリーズ、米国南部/メキシコ南西部の沿岸地域で定期的に確認されている。
引述
緑海亀は世界140か国以上に生息し、産卵地は80か国にある。
ベリーズ、米国南部/メキシコ南西部の沿岸地域で定期的に確認されている。