Core Concepts
RGMが生成する矛盾する応答に焦点を当て、その特徴や解決方法について分析と議論を行う。
Abstract
矛盾する応答の収集と分析が重要であることが強調されている。
大規模なデータセットを構築し、RGMによって生成された矛盾する応答に関する洞察を提供している。
データ駆動型の矛盾抑制手法の効果的な性能向上を示している。
Abstract
矛盾する応答の生成はダイアログシステムにおける重要な課題であり、大規模なデータセットがその解決に有効であることが示唆されている。
Introduction
最近の大規模ニューラルレスポンス生成モデルは進歩しているが、依然として適切な応答を生成することに苦労している。
本論文では、さまざまな高性能RGMによって生成された矛盾した応答の大規模なデータセットを初めて構築し、その特徴や解決方法について詳細に分析している。
Dataset construction
RGM-generated responses to follow-up questions were collected and annotated as contradictory or noncontradictory by human workers.
The dataset provides insights into the characteristics of contradictions in RGM responses.
Analysis of RGM-generated responses
Two types of characteristic contradictions were identified: intra-utterance inconsistencies and ambiguous expressions.
Intra-utterance inconsistencies were found to be common in RGM responses, while ambiguous expressions led to differing judgments on contradictions.
Experiments
A contradiction detector trained on the dataset showed improved performance in identifying RGM contradictions compared to detectors trained on human-written data.
The dataset effectively addressed RGM contradictions even for responses from unfamiliar contexts.
Stats
RGMは8つの異なる高性能モデルから反対意見を収集しました。
Nie et al.(2020b)は15,605件の矛盾した人間作成ダイアログ発話を使用して矛盾検出器をトレーニングしました。
Quotes
"Having access to large contradiction data enables a comprehensive examination of their characteristics."
"No attempt has been made to build an extensive collection of model-generated contradictory responses."