Core Concepts
現在の大規模言語モデルは、自然言語で記述されたプログラムを効果的に実行できることが示されています。
Abstract
本研究では、大規模言語モデル、特にGPT-4が自然言語で記述されたアルゴリズムを理解し、実行する能力を驚異的なパフォーマンスで示しています。これらのモデルは制御フローを追い、正確な計算や操作を行う能力を示しました。また、テキスト出力を通じて変数値を維持および更新する強力な機能も備えています。これらの特性はフォン・ノイマン機械の主要機能を模倣しており、これらのモデルに複雑な操作を単に自然言語プロンプトで指示する可能性があります。この研究が大規模言語モデルの能力評価と活用に光を当てることを期待しています。
Stats
GPT-4は100%の正確さでアルゴリズムタスクを完了
GPT-3.5-TurboとText-Davinci-003は平均35%から36%の正確さ
Quotes
"現在の大規模言語モデルは、特にGPT-4は自然言語で記述されたプログラムを効果的に実行できることが明らかになりました。"
"GPT-4は最長共通部分列タスクで完全な精度を達成した唯一のモデルです。"