Core Concepts
目的指向型対話システムのためのインテント抽出と発話分類のアルゴリズムを提案し、評価を行った。
Abstract
本研究では、目的指向型対話システムの自動シナリオ生成に関する一般的な研究枠組みを提示した。
まず、対話データのJSON形式での前処理を行い、ユーザーのインテントとシステムの応答シナリオブロックを抽出した。
次に、BERTtopicとLDAを用いて、ユーザーのインテントを抽出する手法を比較した。
さらに、ロジスティック回帰とBERTモデルを用いて、ユーザー発話の分類アルゴリズムを比較した。
BERTモデルを用いたアプローチが、Precision 0.80、F1-score 0.78、Matthews相関係数0.74と最も良好な結果を示した。
今後の課題として、シナリオブロックの抽出手法の開発、対話コンテキストを考慮したシナリオグラフの生成アルゴリズムの検討などが挙げられる。
Stats
ユーザーの発話は9つのインテントカテゴリーに分類できる
BERTtopicによる新たなインテントカテゴリーの発見により、合計15のインテントカテゴリーが得られた
BERTモデルによる発話分類の精度はPrecision 0.80、F1-score 0.78、Matthews相関係数0.74と良好であった
Quotes
"現代の機械学習手法を用いることで、目的指向型対話システムのシナリオを自動生成することが可能である。"
"BERTモデルを用いたアプローチが最も優れた分類性能を示した。"