核心概念
投票ベースの半教師あり型アプローチを提案し、典型的なイベント期間を自動的に取得し、それを擬似ラベル付きデータとして利用することで、時間的常識QAタスクの性能を向上させる。
要約
本研究では、時間的常識QAタスクを解決するために、投票ベースの半教師あり型アプローチを提案している。具体的には以下の2つのステップから成る:
ステップ1. 典型的なイベント期間の取得
- Wikipediaから、各イベントを含む文章を抽出し、ドラフトモデルを使って各文章のイベント期間を予測する。
- 各イベントについて、予測された期間の頻度分布を集計し、典型的な期間を投票によって決定する。
- 単峰性の分布の場合は典型的な期間として1つの期間を取得し、二峰性の分布の場合は典型的な期間として2つの期間を取得する。前者は偶発的なイベント、後者は習慣的なイベントとみなす。
ステップ2. 最終モデルの訓練
- ステップ1で取得した典型的期間と対応する文章を使って、擬似ラベル付きのQAデータを生成する。
- 擬似ラベル付きデータを使ってモデルを事前訓練し、その後MC-TACOデータで fine-tuningする。
実験の結果、提案手法は少数の擬似ラベル付きデータ(400イベント)でも、既存の弱教師あり手法を上回る性能を達成できることを示した。また、人手評価の結果、取得した典型的期間ラベルの精度が高いことも確認された。
統計
音楽を演奏するのに一般的に数分から数時間かかる。
学校で音楽を始めるのは通常10歳頃である。
映画の中で音楽は重要な役割を果たし、数分から数時間演奏される。
引用
"彼らは海岸で音楽を演奏しながらくつろいでいる岩バンドに出会った。"
"ヘルメスはそのときに発明したリラで音楽を演奏し始めた。"
"リーは10歳のときに学校で音楽を演奏し始めた。"