核心概念
多源Wizard of Wikipedia(Ms.WoW)は、マルチソースダイアログ知識選択と応答生成を評価するための高品質なベンチマークであり、新しいサポート知識源に対する既存のダイアログモデルのテストを可能にします。
要約
この研究では、オープンドメイン対話生成における知識プラグアンドプレイの重要性が強調されています。Ms.WoWデータセットは、異なるソースから取得された知識タプルを提供し、それらを分割して利用可能なサポート知識に基づいています。さらに、新しいサポート知識源が利用可能になった場合のモデルの適応性を検証するためのダイアログ知識プラグアンドプレイチャレンジが導入されています。
統計
OPIEC(Gashteovski et al.、2019)は大規模なデータセットであり、ウィキペディアのテキストから抽出された情報を使用しています。
セマンティックフレームは文全体からコアセマンティクスを捉えます。
Wikidataはウィキペディア記事に基づく三つ組情報を含んでいます。
ワード数平均:OPIEC(8.7)、セマンティックフレーム(22.1)、Wikidata(5.6)、Wikipedia(24.9)
引用
"多源Wizard of Wikipedia(Ms.WoW)は、マルチソースダイアログ知識選択と応答生成を評価するための高品質なベンチマークです。"
"新しいサポート知識源が利用可能になった場合、既存のダイアログモデルがその追加情報を活用できるかどうかが重要です。"