研究論文
Colombani, S., Ognibene, D., & Boccignone, G. (2024). One to rule them all: natural language to bind communication, perception and action [Conference paper]. In D. Aineto, R. De Benedictis, M. Maratea, M. Mittelmann, G. Monaco, E. Scala, L. Serafini, I. Serina, F. Spegni, E. Tosello, A. Umbrico, & M. Vallati (Eds.), Proceedings of the International Workshop on Artificial Intelligence for Climate Change, the Italian workshop on Planning and Scheduling, the RCRA Workshop on Experimental evaluation of algorithms for solving problems with combinatorial explosion, and the Workshop on Strategies, Prediction, Interaction, and Reasoning in Italy (AI4CC-IPS-RCRA-SPIRIT 2024), co-located with 23rd International Conference of the Italian Association for Artificial Intelligence (AIxIA 2024) (pp. 1–12). CEUR Workshop Proceedings. https://arxiv.org/abs/2411.15033v1
本研究旨在開發一種先進的機器人動作規劃架構,該架構整合了大型語言模型 (LLM),以實現機器人對複雜人類指令的理解,並在動態多變的環境中執行任務。
研究人員開發了一個名為「Planner Module」的規劃模組,該模組利用嵌入在改進版 ReAct 框架中的 LLM 來解釋和執行使用者指令。系統利用 LLM 廣泛的預先訓練知識來處理使用者請求,並透過語義圖提供環境資訊。此外,系統還整合了執行控制和故障管理機制,以應對動態環境中的變化和錯誤。
初步實驗結果顯示,該系統在處理簡單和中等複雜度的請求方面表現良好,但在處理複雜請求時成功率較低,這歸因於系統在理解和處理模糊或不明確指令方面的困難。
該研究提出了一種基於 LLM 的機器人動作規劃架構,該架構具有良好的適應性和與機器人多樣化技能組合的無縫整合能力。透過整合自然語言處理、感知回饋和靈活的任務規劃機制,該系統在複雜、動態的環境中展現出巨大的應用潛力。
該研究對於推進人機互動和機器人在非結構化環境中的自主性具有重要意義。
未來研究方向包括擴展系統的低級技能集、自動擴展 Explainer 模組的資料集、以及研究系統主動獲取環境和人類合作夥伴資訊的能力。
翻譯成其他語言
從原文內容
arxiv.org
深入探究