大規模言語モデル(LLMs)は、多様なタスクで印象的なパフォーマンスを示すが、多段階の推論や目標指向の計画が必要なタスクに苦労する。この研究では、人間の脳から着想を得て、専門的なPFCモジュールと相互作用するLLMベース(GPT-4)モジュールで構成されたブラックボックスアーキテクチャを提案している。このアーキテクチャは、グラフトラバーサル、ハノイの塔、物流といった3つの難しい計画タスクで評価され、従来のLLM方法や競合基準よりも優れた結果を示した。これらの結果は、認知神経科学から得られた知識を活用してLLMsにおける計画能力を向上させる利点を示している。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Taylor Webb,... kl. arxiv.org 03-06-2024
https://arxiv.org/pdf/2310.00194.pdfDybere Forespørgsler