Основні поняття
監視付き質問回答ベースのチューニングにより、対話システムの自然言語理解の性能を大幅に向上させることができる。
Анотація
本研究では、SQATIN (Supervised Question Answering Tuning on INstructions for dialogue NLU)と呼ばれる新しい対話システムの自然言語理解フレームワークを提案している。SQATINは以下の2つの特徴を持つ:
命令チューニング: 自然言語の命令を使ってモデルをチューニングすることで、効率的な学習を実現する。
質問回答ベースの定式化: 意図検出(ID)とスロット抽出(VE)のタスクを質問回答形式で定式化する。これにより、タスク間の知識転移が可能になる。
SQATINは、既存の手法と比べて、両タスクにおいて大幅な性能向上を示した。特に、ドメイン間の知識転移において顕著な改善が見られた。これは、SQATINが各ドメインのクラス(意図やスロット)の自然言語記述の類似性を効果的に捉えられるためである。
さらに、SQATINは、大規模な言語モデルを用いたインコンテキスト学習よりも優れた性能を示した。また、パラメータ効率の高いファインチューニング手法とも互換性があることが確認された。
Статистика
対話システムの自然言語理解タスクでは、通常100以上の意図クラスが定義される。
各クラスの訓練データは限られている場合が多い。
Цитати
"Task-oriented dialogue (TOD) systems help users execute well-defined tasks across a variety of domains (e.g., flight booking or food ordering), with their Natural Language Understanding (NLU) components being dedicated to the analysis of user utterances, predicting users' intents (Intent Detection, ID) and extracting values for informational slots (Value Extraction, VE)."
"In most domains, labelled NLU data is scarce, making sample-efficient learning – enabled with effective transfer paradigms – paramount."