Core Concepts
言語エージェントのためのCoALAフレームワークは、情報格納、行動空間、意思決定手順を組織し、新しいエージェントの開発を導く。
Abstract
最近の努力により、大規模な言語モデル(LLMs)が外部リソース(インターネットなど)や内部制御フロー(プロンプト連鎖など)と組み合わされており、新しい言語エージェントが生まれています。
CoALAは、言語エージェントを記述・設計するための概念的枠組みであり、情報格納、行動空間、意思決定手順に沿ってエージェントを整理します。
記憶モジュール(作業メモリと長期メモリ)、行動空間(内部と外部アクション)、意思決定手順に焦点を当てる。
外部環境への接地アクションや内部メモリからの情報取得などが重要である。
決定サイクルでは提案段階と評価段階があり、選択されたアクションが実行されます。
Stats
LLMsは大量のデータで事前トレーニングされることで幅広いタスクに対応可能。
プロダクションシステムは文字列操作を生成する一方、LLMsはテキスト変更または追加の分布を定義する。
Quotes
"CoALA organizes agents along three key dimensions: their information storage, their action space, and their decision-making procedure."
"Language agents leverage commonsense priors present in LLMs to adapt to novel tasks, reducing the dependence on human annotation or trial-and-error learning."