核心概念
提出一種名為COWP的新算法,利用大型語言模型動態增強基於知識的任務規劃器,以處理開放世界中的意外情況,提高服務機器人的任務完成能力。
摘要
本文提出了一種名為COWP的開放世界任務規劃框架,它利用預訓練的大型語言模型(GPT-3)動態增強基於知識的任務規劃器,以處理開放世界中的意外情況。COWP由三個主要組件組成:任務規劃器、知識獲取器和計劃監控器。
任務規劃器基於閉合世界假設生成初始計劃。計劃監控器使用大型語言模型評估計劃的可行性,如果發現不可行,則向任務規劃器添加新的行動前提條件。如果任務規劃器無法生成計劃,知識獲取器將使用大型語言模型獲取任務相關的常識知識,並將其添加到任務規劃器中。
為了系統地評估COWP,研究人員收集了一個包含561個執行時情況的數據集,涵蓋了餐飲領域的6項任務。實驗結果表明,COWP在任務完成率方面顯著優於三種基線方法。此外,研究人員還在移動操作機器人上演示了COWP的應用。
統計資料
在餐飲領域中,有561個執行時情況被收集和模擬。
每個任務平均有16-27個可區分的情況。
COWP在處理"杯子"、"可樂"、"玻璃杯"和"椅子"相關情況時表現最佳,成功率超過80%。
處理"電源"、"水龍頭"、"碗櫃"和"插頭"相關情況是最具挑戰性的,四種方法(包括COWP)的成功率均較低。
引述
"在餐飲領域中,有561個執行時情況被收集和模擬。"
"COWP在處理'杯子'、'可樂'、'玻璃杯'和'椅子'相關情況時表現最佳,成功率超過80%。"
"處理'電源'、'水龍頭'、'碗櫃'和'插頭'相關情況是最具挑戰性的,四種方法(包括COWP)的成功率均較低。"