Alapfogalmak
該研究提出了一種名為 AllGaits 的全新運動控制架構,透過深度強化學習訓練單一策略,使四足機器人能夠實現所有步態及其轉換,並探討了不同步態、速度和步態風格對能量效率的影響。
研究目標:
本研究旨在開發一種單一控制架構,使四足機器人能夠執行所有已知的步態,並探討不同步態在不同速度下的能量效率,以及步態風格參數對能量效率的影響。
方法:
研究人員提出了一種名為 AllGaits 的分層生物啟發架構,該架構由三個主要部分組成:
高層中心(策略網路): 透過深度強化學習訓練,負責根據感測輸入調節中央樣式產生器(CPG)的參數。
節律產生器和模式形成層(脊髓): 由耦合振盪器網路組成,根據步態耦合矩陣產生節律輸出,並透過模式形成層將其映射到任務空間足部軌跡,進而控制機器人的步態風格,例如身體高度、擺動腳離地高度和腳部偏移。
感測反饋(脊髓傳出副本): 來自車載感測器和內部 CPG 狀態的感測反饋,用於提供機器人狀態資訊給策略網路。
研究人員使用 Isaac Gym 和 PhysX 作為訓練環境和物理引擎,並以 Unitree Go1 四足機器人作為實驗平台。他們訓練了一個單一策略,該策略可以根據不同的步態耦合矩陣和步態風格參數,調節 CPG 的振幅和頻率,從而實現所有九種典型的四足動物步態及其轉換。
主要發現:
該研究成功地訓練了一個單一策略,使機器人能夠執行所有九種典型的四足動物步態,並實現這些步態之間的任意轉換,且無需任何額外調整。
研究發現,對於 Unitree Go1 機器人而言,慢速行走步態和高速踱步步態在能量效率方面是最優的,這意味著該機器人的最佳運動方式可能更接近於駱駝或大象等踱步動物,而不是通常認為的狗或貓。
研究還發現,除了能量效率之外,其他指標(例如基本穩定性和關節加速度)也會受到步態和步態風格的影響,這表明在選擇最佳步態時需要綜合考慮多個因素。
主要結論:
AllGaits 架構提供了一種簡單而有效的方法,可以讓四足機器人實現所有步態及其轉換,並為研究不同步態的能量效率和穩定性提供了一個平台。
研究意義:
該研究推動了四足機器人運動控制領域的發展,為開發更靈活、高效和穩定的四足機器人提供了新的思路和方法。
局限性和未來研究方向:
該研究僅在模擬環境和單一機器人平台上進行了驗證,未來需要在更真實的環境和不同類型的機器人上進行測試。
未來研究可以探索如何將 AllGaits 架構擴展到更複雜的運動任務,例如跳躍、轉彎和穿越障礙物。
Statisztikák
機器人慢速行走步態在速度 0.3-0.9 m/s 時最節能。
機器人高速踱步步態在速度 0.9-3.0 m/s 時最節能。
大多數步態在最低離地間隙(0.02 m)時最節能。
大多數步態在最高身體高度(0.34 m)和高速運動時最節能。