核心概念
本文提出了一個名為 MUSE 的框架,旨在將人類的元認知能力融入人工智慧體,使其能夠在未知情境和環境中更有效地學習、適應和解決問題。
本研究論文介紹了「未知情境與環境下的元認知」(Metacognition for Unknown Situations and Environments,MUSE)框架,旨在提升人工智慧體在陌生環境中的適應能力。
研究背景
現今的人工智慧體多半受限於預先設定的環境和任務,缺乏適應新情境的彈性。雖然大型多任務預訓練模型展現初步成效,但面對真實世界中多變的環境,窮盡所有可能情境的預訓練並不切實際。
MUSE 框架核心概念
MUSE 框架借鑒人類的元認知能力,將「自我意識」和「自我調節」融入人工智慧體的決策過程中。自我意識讓智慧體能評估自身能力,而自我調節則根據自我評估結果調整策略。
MUSE 框架實作方法
研究團隊提出了兩種 MUSE 框架的實作方式:
基於世界模型:利用解碼器式世界模型預測任務成功率,並透過自我調節機制選擇最可能成功的行動方案。
基於大型語言模型 (LLM):結合 ReAct 和 Reflexion 機制,利用 LLM 生成多種未來情境,並透過自我意識模型評估其成功率,最終選擇最優行動方案。
實驗結果
在 Meta-World 機器人操控模擬器和 ALFWorld 文字遊戲模擬器中的實驗結果顯示,相較於 Dreamer-v3 等基線模型,MUSE 智慧體在處理新情境時展現更優異的效能。
研究結論
MUSE 框架為開發更具適應力的自主智慧體提供新的研究方向,未來可應用於各種需要應對未知環境的領域。
統計資料
MUSE 在 Meta-World 環境中對新任務的成功率預測準確率達 92%,而 Dreamer-v3 僅有 39%。
MUSE 在 ALFWorld 環境中對新任務的成功率預測 AUROC 值為 0.93,準確率為 85%。
在 ALFWorld 環境中,MUSE 智慧體在 134 個新任務上的成功率達到 90%,相較於 ReAct 和 Reflexion 分別提升了 150% 和 75%。