Core Concepts
ファクトイド質問に対するヒントを自動生成することで、人間の認知能力の刺激と維持、および人間の優れた推論スキルの確保を目指す。
Abstract
本研究では、ファクトイド質問に対する自動ヒント生成のフレームワークを提案し、それを用いて「TriviaHG」と呼ばれる新しい大規模データセットを構築した。TriviaHGには、TriviaQAデータセットから抽出した16,645の質問に対応する160,230個のヒントが含まれている。
また、ヒントの収束性(Convergence)と馴染み度(Familiarity)の2つの品質属性を自動的に評価する手法を提案した。10人の評価者による手動評価と6人の被験者によるヒントを使った質問回答実験を行った結果、ヒントの有効性が示された。ヒントの品質は答案の難易度に依存し、自動評価手法は人間の評価と強い相関を示すことが明らかになった。
Stats
質問の答案が簡単な場合、ヒントの成功率は96%だった。
質問の答案が中程度の難易度の場合、ヒントの成功率は78%だった。
質問の答案が難しい場合、ヒントの成功率は36%だった。
Quotes
"ファクトイド質問に対するヒントを自動生成することで、人間の認知能力の刺激と維持、および人間の優れた推論スキルの確保を目指す。"
"ヒントの品質は答案の難易度に依存し、自動評価手法は人間の評価と強い相関を示す。"