核心概念
提案モデルIDPTは、対話の主導権を表す接頭辞パラメータを動的に調整することで、適切な主導権に基づいた応答を生成する。
要約
本研究では、対話システムにおける応答生成時の主導権の重要性に着目している。提案モデルのIDPTは、主導権に関する情報を接頭辞パラメータとして分離し、主導権に応じて動的に応答を生成する。
具体的には以下の通り:
対話レベルと発話レベルの2つの主導権を定義し、合計4つの主導権クラスを設定
主導権認識モジュールと主導権に応じた応答生成モジュールから構成
主導権認識モジュールでは、対話履歴とプレフィックスパラメータの相互作用を通じて主導権を予測
応答生成モジュールでは、予測された主導権に応じて適切なプレフィックスパラメータを選択または組み合わせて応答を生成
教師あり学習と教師なし学習の両方に対応可能
提案手法は、2つの公開対話データセットで既存手法を上回る性能を示した。また、主導権を操作した場合でも適切な応答を生成できることを確認した。
統計
対話システムにおいて、主導権の違いによって応答が大きく変わる。
主導権を考慮せずに応答生成モデルを学習すると、主導権の混同による不適切な応答が生成される可能性がある。
主導権ラベルの収集は手間がかかるため、ラベルが少ない状況でも対応可能な手法が求められる。
引用
"混合主導権は対話の方向性を制御する上で重要な要因の1つである。話し手が受動的に応答するか、積極的にリードするかによって、応答は大きく異なる。"
"しかし、ほとんどの対話システムは主導権の区別なく全体的な応答生成モデルを訓練しており、主導権の混同による不適切な応答が生成される問題がある。"