מושגי ליבה
本文提出了一種名為 FLOWRETRIEVAL 的新方法,透過利用光流表徵從先前數據集中檢索具有相似運動模式的數據,以改進機器人小樣本模仿學習。
תקציר
FlowRetrieval:以流程引導數據檢索實現小樣本模仿學習
本研究旨在解決機器人小樣本模仿學習中數據效率低下的問題,特別是當目標任務只有少量演示數據時。研究提出了一種名為 FLOWRETRIEVAL 的新方法,透過利用光流表徵從先前數據集中檢索具有相似運動模式的數據,以增強學習效率。
FLOWRETRIEVAL 方法分為三個階段:
以運動為中心的預訓練: 利用光流作為運動相似性的表徵,並使用變分自動編碼器 (VAE) 對光流數據進行嵌入,創建一個能夠評估光流之間相似性的潛在空間。
數據檢索: 根據先前數據集中每個數據點與目標任務數據在潛在空間中的距離進行排序,並檢索排名最高的相似數據點。
流程引導學習: 除了使用檢索到的數據進行訓練外,還引入了一個預測光流的輔助損失函數,以鼓勵模型學習以運動為中心的表徵,從而更好地利用檢索到的數據。