核心概念
言語モデルエージェントの能力を向上させるために、言語モデルのパラメータを変更せずに、エージェントの関数を最適化する新しいトレーニングパラダイムを提案する。
要約
本研究では、言語モデルエージェントの能力を向上させるための新しいトレーニングパラダイムを提案している。従来のモデルトレーニングでは、モデルのパラメータを最適化するのに対し、本手法ではエージェントの関数を最適化する。
具体的には、関数を学習可能な「エージェントパラメータ」として扱い、人工知能のモデルトレーニングの基本的なアイデアを活用する。AgentOptimizerを開発し、言語モデルを使ってエージェントの関数を更新する。また、パフォーマンス低下を避けるために、ロールバックと早期停止の2つの戦略を導入する。
広範な実験の結果、提案手法によりGPT-4+エージェントやReActエージェントの性能が大幅に向上することが示された。さらに、学習曲線や分野間の転移可能性など、エージェントトレーニングの振る舞いについても分析を行った。
統計
中級代数の訓練精度は40%から65%に向上した。
幾何学の訓練精度は30%から40%に向上した。
確率と組み合わせの訓練精度は65%から65%を維持した。
引用
「人間が道具を作り出して現実世界のタスクに適応するのと同様に、言語モデルエージェントの関数を最適化することで、言語モデルの能力を向上させることができる」
「関数を学習可能な'エージェントパラメータ'として扱い、人工知能のモデルトレーニングの基本的なアイデアを活用することで、言語モデルエージェントの能力を向上させることができる」