本研究では、大規模言語モデルを用いた対話状態追跡(DST)のための効率的な会話検索手法を提案している。
まず、会話の要約をキーとして使うことで、従来の方法よりも効果的な会話検索を実現している。会話の要約は、会話履歴を踏まえつつ、現在の発話の意図を簡潔に表したものである。これにより、単純な単語や文の類似性では捉えきれない会話の構造的な類似性を捉えることができる。
さらに、会話要約を生成するための言語モデルを蒸留することで、会話要約を生成せずに直接会話をベクトル化し、効率的な検索を可能にしている。この手法では、事前に会話要約を生成して検索インデックスを構築しておき、テスト時には会話をベクトル化して検索を行うため、要約生成のコストを削減できる。
実験の結果、提案手法は、事前に対話データでファインチューニングした従来の検索手法よりも優れた性能を示し、少量の対話データでも高い汎化性能を発揮することが確認された。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések