المفاهيم الأساسية
小規模言語モデルに手続き知識と(制約付き)言語プランニング機能を付与する新しい2つのアプローチを提案する。
الملخص
本論文では、手続き知識を小規模言語モデルに付与する新しい2つのアプローチを提案している。
-
手続き知識の象徴的な蒸留:
- 大規模言語モデルから手続き知識を生成し、小規模言語モデルに転移する。
- 2段階のプロセス: (1)知識の言語化、(2)知識の蒸留。
-
推論時のアルゴリズム:
- 標準的な次トークン予測目的では、因果推論と時間的推論の能力が不足している。
- ステップごとの検証器付きビームサーチを導入し、より体系的で正確な推論を可能にする。
提案手法では、以下の3つのタスクに取り組む:
- 標準的な言語ベースのプランニング
- 制約付きプランニング
- 反事実的再プランニング
実験の結果、提案手法により、大規模モデルと比肩する性能を持つ小規模モデルを実現できることを示した。特に、制約付きプランニングと反事実的再プランニングでは、人間評価で93%と86%の有効性を達成した。さらに、仮想環境VirtualHomeでの実験でも、提案モデルが大幅に優れた性能を示した。
الإحصائيات
手続き知識を持つ小規模モデルは、大規模モデルと比較して、標準的なプランニングタスクで平均17.57%の相対的な改善を達成した。
制約付きプランニングタスクでは、提案モデルが93.33%の成功率を示した。
反事実的再プランニングタスクでは、提案モデルが86.33%の成功率を示した。
اقتباسات
"小規模言語モデルに手続き知識と(制約付き)言語プランニング機能を付与する新しい2つのアプローチを提案する。"
"実験の結果、提案手法により、大規模モデルと比肩する性能を持つ小規模モデルを実現できることを示した。"
"特に、制約付きプランニングと反事実的再プランニングでは、人間評価で93%と86%の有効性を達成した。"