核心概念
本文提出了一種基於先天物理知識的閉環多步規劃框架,該框架利用物理模擬來預測和選擇機器人動作序列,從而實現更有效率且穩健的導航。
本文提出了一種分層框架,將機器人規劃作為輸入控制問題來解決。最低級別是臨時閉環控制迴路(“任務”),每個迴路代表一種行為,取決於特定的感官輸入,因此是臨時的。最高級別是一個監督“配置器”,指導任務的創建和終止。這裡存在著作為物理引擎的“核心”知識,可以在其中模擬任務序列。配置器根據模擬結果對其進行編碼和解釋,並基於此選擇任務序列作為計劃。我們在一個真實的機器人上實現了這個框架,並在一個超車場景中對其進行了測試,以作為概念驗證。
研究目標
本研究旨在開發一種新的機器人規劃框架,該框架結合了閉環控制和基於物理模擬的“核心”知識,以實現多步預測和決策。
方法
任務作為閉環控制器: 將機器人行為定義為臨時閉環控制迴路(“任務”),這些迴路根據感官輸入觸發並執行。
配置器: 引入一個監督模塊“配置器”,負責使用物理引擎模擬任務序列,評估其結果,並選擇最佳序列作為計劃。
核心知識: 利用物理引擎 Box2D 作為“核心”知識,根據機器人感測器數據構建模擬環境,並模擬不同動作序列的結果。
認知地圖構建: 使用最佳優先搜索算法和成本函數,探索可能的任務序列,並構建一個表示狀態空間的認知地圖。
計劃提取: 從認知地圖中提取成本最低的任務序列作為最終計劃。
主要發現
在超車場景測試中,與僅使用單一閉環控制器的反應式策略相比,該框架使機器人能夠成功規劃避開障礙物並到達目標位置的路線。
該框架能夠在短時間內完成狀態空間探索和規劃,平均耗時 0.064 秒。
主要結論
將閉環控制與基於物理模擬的“核心”知識相結合,可以實現更有效率和穩健的機器人規劃。
物理模擬為機器人提供了預測和評估不同動作序列結果的能力,從而無需進行實際探索即可做出明智的決策。
意義
本研究提出了一種創新的機器人規劃方法,為開發更自主和智能的機器人系統提供了新的思路。
該框架有可能應用於各種機器人任務,例如導航、操作和人機交互。
局限性和未來研究方向
本研究僅在一個特定的超車場景中測試了該框架,未來需要在更複雜的環境中進行更全面的評估。
目前,該框架僅考慮了靜態障礙物,未來可以擴展到處理動態障礙物和多機器人協作等更具挑戰性的場景。
統計資料
目標位置 DG 位於機器人前方 1 米處。
平均規劃時間為 0.064 ± 0.009 秒。
平均狀態空間大小為 32.9 ± 1.758 個狀態。
在規劃條件下,機器人在十次運行中均成功到達目標位置。
在反應式條件下,機器人在十次運行中均未到達目標位置,並且與障礙物發生了 8 次碰撞。