핵심 개념
デジタル技術の活用に苦慮する人々のために、不明確な質問を含む質問データセットを構築し、対話型の自動チューターシステムの開発を目指す。
초록
本論文では、デジタル技術に不慣れな人々が抱える課題に取り組むため、以下の3つのデータセットの構築を提案している。
- 既存のオンラインフォーラムからマイニングした質問データ
- Yahoo Answersなどのデータから、デジタルリテラシーに関連する質問を収集し、質問の特徴(情報不足、言葉の不適切さなど)を分類する。
- デジタルリテラシーチューターの経験記録
- 10年以上にわたるチューター-学習者の対話記録を分析し、学習者の知識ギャップや質問の問題点、効果的な指導方法を抽出する。
- チューターへのインタビューも実施し、質問の問題点と対処方法を収集する。
- 実際の対話セッションの録音データ
- 地域図書館でチューターと学習者の対話セッションを録音し、学習者の理解度や質問の問題点、適切な回答方法を注釈付きで記録する。
これらのデータセットを活用し、以下の2つの研究課題に取り組む。
- 不明確な質問に対するLLMの対応方法
- 質問の問題点を検出し、質問を改善するためのプローブ質問を生成する手法の開発
- 対話型自動チューターシステムの構築
- チューターの対話戦略をLLMに統合し、学習者のデジタルリテラシーレベルに合わせた適切な支援を行う対話システムの開発
本研究では、デジタル初心者の支援に役立つ新しいリソースの提供を目指している。
통계
デジタルリテラシーに関連する質問を含むYahoo Answersデータセットには、140,000件の訓練サンプルと6,000件のテストサンプルが含まれている。
10年以上にわたるデジタルリテラシーチューターの対話記録が数百件蓄積されている。