本研究では、言語モデルエージェントの能力を向上させるための新しいトレーニングパラダイムを提案している。従来のモデルトレーニングでは、モデルのパラメータを最適化するのに対し、本手法ではエージェントの関数を最適化する。
具体的には、関数を学習可能な「エージェントパラメータ」として扱い、人工知能のモデルトレーニングの基本的なアイデアを活用する。AgentOptimizerを開発し、言語モデルを使ってエージェントの関数を更新する。また、パフォーマンス低下を避けるために、ロールバックと早期停止の2つの戦略を導入する。
広範な実験の結果、提案手法によりGPT-4+エージェントやReActエージェントの性能が大幅に向上することが示された。さらに、学習曲線や分野間の転移可能性など、エージェントトレーニングの振る舞いについても分析を行った。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor