Keskeiset käsitteet
対話参加者の言語パターンが収束する言語の同期化は、より自然な対話体験を生み出すが、ほとんどの対話システムにはそのための仕組みがない。本研究では、共有語彙の活用によって、GPT-2ベースのエンドツーエンドのタスク指向対話システムにおいて言語の同期化を実現する手法を提案する。
Tiivistelmä
本研究では、言語の同期化(entrainment)を実現するための3つのアプローチを提案している。
- 訓練データの重み付け(Instance Weighting)
- ユーザーの発話と対話システムの出力の重複度が高い訓練事例に高い重みを付与する。
- 2つの重み付け関数を検討し、ベースラインモデルよりも高い言語の同期化を実現した。
- ユーザー語彙の尤度損失(User Likelihood Loss)
- ユーザーの発話に含まれる語彙の出現確率を高めることで、言語の同期化を促進する。
- 損失関数の重み付けを変化させることで、言語の同期化とタスク達成のバランスを調整できる。
- キーワードに基づく生成の条件付け(Conditioning on Lexical Keywords)
- ユーザーの発話に含まれる語彙をキーワードとして生成に組み込むことで、言語の同期化を高める。
- 訓練時にキーワードの確率的な混合を行うことで、生成の流暢性を維持しつつ、言語の同期化を実現した。
これらの手法は、自動評価指標と人手評価の両方で、ベースラインモデルよりも高い言語の同期化を示した。特に、訓練データの重み付けと、キーワードに基づく生成の条件付けは、言語の同期化を高めつつ、タスク達成率も維持できることが確認された。
Tilastot
対話システムの出力と、ユーザーの発話の1-gramの重複率は18.1%である。
対話システムの出力と、ユーザーの発話の2-gramの一致率は13.0%、3-gramの一致率は3.8%である。