本文提出了一種名為COWP的開放世界任務規劃框架,它利用預訓練的大型語言模型(GPT-3)動態增強基於知識的任務規劃器,以處理開放世界中的意外情況。COWP由三個主要組件組成:任務規劃器、知識獲取器和計劃監控器。
任務規劃器基於閉合世界假設生成初始計劃。計劃監控器使用大型語言模型評估計劃的可行性,如果發現不可行,則向任務規劃器添加新的行動前提條件。如果任務規劃器無法生成計劃,知識獲取器將使用大型語言模型獲取任務相關的常識知識,並將其添加到任務規劃器中。
為了系統地評估COWP,研究人員收集了一個包含561個執行時情況的數據集,涵蓋了餐飲領域的6項任務。實驗結果表明,COWP在任務完成率方面顯著優於三種基線方法。此外,研究人員還在移動操作機器人上演示了COWP的應用。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yan Ding, Xi... lúc arxiv.org 10-01-2024
https://arxiv.org/pdf/2210.01287.pdfYêu cầu sâu hơn