核心概念
提出一種新的神經符號任務規劃管道,利用神經網絡語言模型作為L-Model和L-Policy,通過將複雜任務分解為子目標來減少規劃時間並提高成功率。
摘要
本文提出了一種新的神經符號任務規劃管道,旨在解決當前符號規劃器和基於神經網絡語言模型(LLM)的規劃器的局限性。
首先,該管道利用多模態LLM同時處理圖像和文本提示,生成包含環境物體、初始狀態和目標狀態的PDDL問題描述。
其次,該管道利用LLM作為L-Model,將複雜的任務分解為多個子目標,從而減少整體的搜索空間,提高LLM的規劃準確率。
對於每個子目標,該管道根據子目標的複雜度,選擇使用符號規劃器或基於MCTS的LLM規劃器進行規劃。符號規劃器可以精確地解決相對簡單的子目標,而MCTS LLM規劃器則可以處理更加複雜的子目標。
實驗結果表明,與現有的LLM規劃器相比,該管道在不同的公開任務規劃域以及真實和模擬的機器人環境中,顯著減少了規劃時間,同時保持了較高的成功率。
統計資料
在Barman-new域中,當n增加時,符號LLM規劃器的規劃時間增加迅速,而MCTS LLM規劃器的規劃時間增加緩慢,表現更好。
在Blocksworld-new和Gripper-new域中,符號LLM規劃器的規劃時間增加較緩,優於MCTS LLM規劃器。
增加MCTS LLM規劃器中採樣計劃的數量(ns)可以提高成功率,但也會增加規劃時間。
引述
"我們提出的神經符號任務規劃管道顯著減少了規劃時間,同時保持了較高的成功率。"
"我們的MCTS LLM規劃器與和不使用目標分解的版本相比,成功率大幅提高,證明了目標分解策略的有效性。"