Conceptos Básicos
大規模言語モデルは、少数の例と中間ステップを与えられると、様々な推論タスクで優れた性能を発揮する。しかし、暗黙の知識に依存する手法では、その知識が間違っていたり課題と一致しない場合、誤った答えを生成してしまうことがある。この問題に取り組むため、我々は仮説から理論(Hypotheses-to-Theories: HtT)と呼ぶフレームワークを提案する。HtTは、誘導段階と演繹段階の2つのステージから成る。誘導段階では、言語モデルに訓練例に対してルールを生成・検証させ、十分に正しいと確認されたルールを集めてルールライブラリを構築する。演繹段階では、言語モデルにこのルールライブラリを活用して推論を行わせることで、誤った推論を減らすことができる。数値推論と関係推論の問題で実験を行った結果、HtTは既存の手法に対して11-27%の精度向上を示した。また、学習したルールは異なるモデルや同じ問題の別の形式にも転用できることがわかった。
Resumen
本論文では、大規模言語モデル(LLM)の推論能力を向上させるため、Hypotheses-to-Theories (HtT)と呼ばれるフレームワークを提案している。
HtTは以下の2つのステージから構成される:
誘導段階:
LLMに訓練例に対してルールを生成・検証させる
十分に正しいと確認されたルールを集めてルールライブラリを構築する
演繹段階:
LLMにルールライブラリを活用して推論を行わせる
これにより、暗黙の知識に依存する手法で見られる誤った推論を減らすことができる
実験では、数値推論と関係推論の問題に対してHtTを適用し、既存の手法に比べて11-27%の精度向上を示した。また、学習したルールは異なるモデルや同じ問題の別の形式にも転用できることがわかった。
HtTの主な特徴は以下の通り:
LLMに仮説を生成させ、検証を通じて正しいルールを発見する点で、科学的発見のプロセスに着想を得ている
暗黙の知識に依存する手法の課題であるホールシネーションを低減できる
ルールの生成と検証を1つのステップにまとめた「誘導から演繹」手法を提案し、プロンプトエンジニアリングの手間を軽減している
XMLタグを使ったルール検索手法により、LLMの検索能力を向上させている
HtTは、LLMの推論能力を大幅に向上させる新しい手法として注目に値する。
Estadísticas
6 + 4 = 11
7 + 1 + 1 = 10
8 + 5 + 1 = 15
6 + 7 = 13
8 + 8 + 1 = 18
Citas
"When prompted with a few examples and intermediate steps, large language mod-
els (LLMs) have demonstrated impressive performance in various reasoning tasks."
"To tackle this problem, we present Hypotheses-to-Theories (HtT), a framework that learns a rule library for reasoning with LLMs."
"Experiments on both numerical reasoning and relational reasoning problems show that HtT improves existing prompting methods, with an absolute gain of 11-27% in accuracy."