大規模言語モデルを使って、知識源の選択、知識検索、応答生成の3つのサブタスクを統一的に処理し、個人化された対話応答を生成する。
検索支援型生成を用いた対話システムの構築を促進し、実世界の顧客サービスシナリオにおける課題に取り組むことが本チャレンジの目的である。
LLMベースの対話システムにおいて、出力の信頼性を定量化し、活用することは重要である。本研究では、対話状態追跡タスクにおいて、様々な手法による信頼性推定手法を検討し、その有効性を示した。
本研究では、対話生成の多様性を高めるために、潜在変数を用いた拡散モデルを提案する。潜在変数を用いることで、より柔軟な事前分布を学習でき、より細かな多様性を生成できる。また、低次元の潜在空間での推論を行うことで、拡散モデルの推論効率を大幅に改善できる。
対話参加者の言語パターンが収束する言語の同期化は、より自然な対話体験を生み出すが、ほとんどの対話システムにはそのための仕組みがない。本研究では、共有語彙の活用によって、GPT-2ベースのエンドツーエンドのタスク指向対話システムにおいて言語の同期化を実現する手法を提案する。
会話要約を検索キーとして使うことで、効率的かつ効果的な会話検索を実現し、大規模言語モデルを用いた対話状態追跡の性能を大幅に向上させることができる。
ラベル無しデータを活用することで、ゼロショット対話状態追跡をフューショット対話状態追跡に変換することができる。
中間ステップのデータが利用できない状況でも、自己生成したサンプルを活用して中間ステップと最終応答の生成性能を向上させる。
適合的な意図分類と明確化(CICC)は、タスク指向型対話システムにおける迅速かつ正確な意図分類のためのフレームワークを提示する。このフレームワークは、任意の意図分類器の発見的な不確実性スコアを、事前に定義された信頼水準で真の意図を含む明確化質問に変換する。少数の可能性の高い意図間の曖昧さを解消することで、ユーザーの問い合わせを迅速かつ正確に解決できる。さらに、このフレームワークをスコープ外検出に拡張することを提案する。
本研究では、内発的動機付け強化学習アルゴリズムを活用することで、マルチタスク対話システムの行動評価と学習を改善することを目的としている。