核心概念
大規模言語モデルと未ラベルの対話データを活用し、API定義のみから完全に教師なしで対話システムを構築する。
要約
本論文は、大規模言語モデルと未ラベルの対話データを活用し、API定義のみから完全に教師なしで対話システムを構築する手法を提案している。
具体的には以下の通り:
- 未ラベルの対話データと API スキーマのみを入力として、対話状態(API呼び出し引数)と対話アクトを潜在変数として推定する。
- ノイズチャネルモデルを用いた prompting 手法により、これらの潜在変数を高精度に推定する。
- 推定された擬似ラベルを用いて、エンドツーエンドの対話システムをファインチューニングする。
- 推定された擬似ラベルの品質を向上させるため、Hard-EMによる反復的な改善を行う。
提案手法は、教師なしでMultiWOZベンチマークの対話成功率を大幅に向上させ、従来の教師あり手法に匹敵する性能を達成している。また、対話状態推定の精度も高く、完全に教師なしで高品質な対話システムを構築できることを示している。
統計
対話システムの成功率は従来の教師あり手法の2倍以上に向上した。
対話状態推定の正解率は39.7%に達した。
引用
"大規模言語モデルを活用し、教師なしで対話システムを構築できることを示す"
"ノイズチャネルモデルを用いた prompting 手法により、高精度な擬似ラベルを生成できる"
"Hard-EMによる反復的な改善で、擬似ラベルの品質を向上させる"