核心概念
本稿では、大規模な実運用ワークフローデータを用いてオープンソースの大規模言語モデルをファインチューニングすることで、専門性の高いウェブエージェントを開発できることを示している。
要約
ScribeAgent: 実運用規模のワークフローデータを用いた、特化したウェブエージェントに向けて
本稿では、大規模な実運用ワークフローデータを用いて、特化したウェブエージェントを開発できることを示しています。著者らは、Scribeというソフトウェアを通じて収集した60億トークンを超える大規模なワークフローデータセットを用いて、オープンソースのLLMをファインチューニングし、ScribeAgentを開発しました。
ScribeAgentは、ウェブサイトのDOMと過去の行動履歴に基づいて、次のステップを直接生成できる、専門化された単一ステージのLLMエージェントです。これは、ターゲット要素の候補を絞り込んでから選択するなどの複数ステージを必要とする従来のファインチューニング済みエージェントとは対照的です。
高精度: ScribeAgentは、既存のベンチマークにおいて、プロプライエタリなGPT-4ベースのエージェントや複数ステージのエージェントを大幅に上回るパフォーマンスを示しています。
汎用性: ScribeAgentは、幅広いウェブサイトやタスクにわたって効果的に機能します。
効率性: ScribeAgentは、オープンソースのLLMを使用しているため、推論コストを削減できます。