Conceitos essenciais
本文提出了一種基於動詞的機器人技能泛化方法,使機器人能夠理解和執行應用於新物件的自然語言指令。
本研究旨在開發一種模型,使機器人能夠將以動詞標記的技能泛化到新的物件類別。具體而言,該模型應能根據輸入的動詞和物件的運動學模型,輸出一個可應用於該物件以實現動詞效果的軌跡。
研究人員提出了一個由分類器和優化器組成的兩部分模型:
分類器
採用卷積神經網路 (CNN) 架構,輸入為物件軌跡的 RGB 圖像序列,輸出為每個動詞的預測概率陣列。
透過 k 折交叉驗證對分類器進行訓練和測試,使用 k-1 個物件類別進行訓練,並在未見過的第 k 個物件類別上進行測試。
軌跡優化器
使用協方差矩陣自適應進化策略 (CMA-ES) 演算法,搜索物件自由度的軌跡(例如,6 自由度姿態和關節狀態),以最大化分類器返回的目標動詞概率。
透過最小化分類器輸出的動詞概率陣列與指示目標動詞的單熱目標陣列之間的分類交叉熵來測量損失。