核心概念
AgentStore 是一個可擴展的平台,用於動態整合異構代理以自動執行電腦任務,旨在通過整合專精代理和通用代理來增強人機交互。
這篇研究論文介紹了 AgentStore,一個為自動化作業系統任務而設計的創新平台。AgentStore 的核心概念是動態整合異構代理,使其能夠獨立或協作地執行複雜的電腦任務。
研究目標
本研究旨在解決現有代理方法在泛化和專精能力方面的不足,特別是在處理現實世界環境中開放式電腦任務方面的不足。研究目標是開發一個可擴展的平台,可以動態整合異構代理,以自動執行作業系統任務,並增強人機交互。
方法
AgentStore 由三個主要組件組成:AgentPool、AgentEnroll 和 MetaAgent。AgentPool 儲存所有具有獨特功能的特徵特定代理。AgentEnroll 定義用於將新代理添加到 AgentPool 的整合協議。MetaAgent 從 AgentPool 中選擇最合適的代理,以獨立或協作地完成任務。
主要發現
AgentStore 在具有挑戰性的 OSWorld 基準測試中,成功率達到 23.85%,比之前最佳系統的性能提高了一倍多。
在移動環境中評估 AgentStore 時也觀察到了類似的結果,證明了該方法對跨多個作業系統平台自動執行任務的適應性。
與其他策略相比,AgentToken 範例具有更廣泛的適用性,突出了其在訓練中的效率及其在 AgentStore 中動態管理代理的有效性。
主要結論
AgentStore 通過整合專精代理和通用代理,克服了先前方法的局限性。這種方法增強了代理系統在泛化和專精方面的能力,標誌著在開發專精型通用電腦助理方面邁出了重要一步。
意義
這項研究對開發更強大、更通用的電腦助理具有重要意義。通過整合專精代理,AgentStore 可以處理更廣泛的任務,並適應不斷發展的作業系統環境。
局限性和未來研究
未來的研究方向包括探索更先進的 MetaAgent 架構、開發更有效的代理協作機制,以及評估 AgentStore 在更廣泛的現實世界場景中的性能。
統計資料
在極具挑戰性的 OSWorld 基準測試中,AgentStore 的成功率達到了 23.85%,比之前最佳系統的 11.21% 提高了一倍多。
在移動環境中,AgentStore 將性能從 26.7% 顯著提高到 57.8%。
當演示集大小達到 100 時,可以達到令人滿意的準確率。