為了解決複雜的實際問題,多智能體系統需要一個中央實體(即元智能體)來自動生成任務特定的操作流程,並協調各種智能體的活動。本研究提出了一個新的代理導向規劃框架,通過快速任務分解和分配、基於獎勵模型的有效評估,以及反饋循環等機制,確保每個子任務都能得到有效解決,從而為原始用戶查詢提供全面的答案。
本文提出了一個視覺分析系統MARLens,用於深入理解基於多智能體強化學習的交通信號控制模型。該系統能夠從多個角度探索和分析模型的決策過程,增強對模型行為的理解。
本文提出了LaMMA-P,一種將大型語言模型的推理能力與傳統啟發式搜索規劃算法相結合的新型多智能體任務規劃框架,在長期任務執行方面實現了最先進的性能。
本文提出了一個名為MARLadona的新框架,能夠通過端到端強化學習訓練出具有複雜團隊合作行為的多智能體足球策略。
提出一種新的計算管道,使多智能體強化學習(MARL)代理能夠通過對話語料庫的語言基礎來學習可解釋的溝通協議,以實現在臨時團隊中的有效協作。
本研究提出了一個新的團隊合作博弈模型,並提出了一個多智能體多臂老虎機系統,能夠學習並收斂到該博弈的納什均衡的近似值。這有助於更好地理解自願性協作動態。
提出一種新的多智能體多環境混合 Q 學習算法,用於部分去中心化無線網路優化。該算法結合了多環境 Q 學習的優勢,並採用貝葉斯方法在協調狀態下估計聯合狀態,從而減少了信息共享的成本。
本文提出了一個名為SymAware的新型軟體開發框架,用於開發具有情境感知能力的可信賴多智能體系統。該框架提供了一套豐富的預定義數據結構,用於計算、存儲和傳輸智能體的情境感知信息。它還提供了一個抽象接口,使智能體能夠考慮其周圍智能體的感知、知識和風險來計算其控制輸入。此外,SymAware利用一組專門的組件隱藏了模擬引擎的繁重計算和通信接口,從而在概念原型和實際應用之間實現了高效的實施。通過三個多智能體案例研究,驗證了該軟體框架的有效性和效率。
本文提出了一種新的方法,將速度障礙(VO)和控制屏障函數(CBF)相結合,以解決多智能體碰撞迴避問題。該方法利用VO提供的引導,同時使用CBF確保安全,克服了單獨使用VO可能產生的過於保守的行為。
提出一種基於社會力的多智能體系統模型,能夠通過分散式控制實現機器人群體在複雜未知環境中的協作穿越。