Основні поняття
ラベル無しデータを活用することで、ゼロショット対話状態追跡をフューショット対話状態追跡に変換することができる。
Анотація
本論文は、ゼロショット対話状態追跡(DST)の問題を解決するための新しい手法を提案している。従来のゼロショット DSTは転移学習のみを適用していたが、本手法では、ターゲットドメインのラベル無しデータを活用することで、フューショット DSTに変換することができる。
具体的には以下の3つのステップから成る:
- 主タスクと補助タスクの共同学習
- 主タスクはスロット値の生成、補助タスクはスロット型の生成を行う
- 両タスクの循環一貫性を利用することで、ターゲットドメインのラベル無しデータから良質なサンプルを選択できる
- 選択したサンプルを用いたファインチューニング
- 選択したサンプルを使ってDSTモデルをファインチューニングすることで、ゼロショットをフューショットに変換する
- 新しいスロット型の生成
- 補助タスクを使って、既存のスロット型以外の新しいスロット型を生成できる
提案手法は、一般的な言語モデルにも適用可能であり、MultiWOZとSGDデータセットでの評価実験で、従来手法を大幅に上回る性能を示した。
Статистика
対話履歴中の「Hilton Hotel」がホテル名のスロット値であることを示す文
対話履歴中の「5 nights」がホテルの滞在日数のスロット値であることを示す文
Цитати
"Previous zero-shot dialogue state tracking (DST) methods only apply transfer learning, ignoring unlabelled data in the target domain."
"We transform zero-shot DST into few-shot DST by utilising such unlabelled data via joint and self-training methods."