這篇研究論文介紹了一種名為 NUE(基於不確定性驅動探索的導航)的新型端到端視覺運動導航框架。NUE 旨在增強機器人在未知環境中探索和導航到目標的能力。
現有的認知導航框架主要關注機器人在目標導航階段(即 exploitation)的表現,而忽略了對其探索行為(exploration)的設計。然而,在陌生環境中尋找目標時,探索對於建立認知至關重要。
NUE 框架利用 NeRF(神經輻射場)作為其記憶結構,並通過估計 NeRF 的不確定性來增強機器人的探索能力。該框架包含三個關鍵流程:
為了生成探索性思維,NUE 從 NeRF 中提取不確定性特徵。NeRF 輸出的不確定性被渲染成不確定性地圖,該地圖反映了 NeRF 對當前視角下場景不同區域的熟悉程度。然後,使用 ResNet 網絡和 CBAM 注意力機制從不確定性地圖中提取特徵,以指導機器人探索未知區域。
為了生成目標導航性思維,NUE 從 NeRF 中提取空間特徵。通過對 NeRF 中間層生成的體素密度和顏色特徵進行體素渲染,生成壓縮的空間特徵圖。然後將目標 RGB 圖像與空間特徵圖連接,並使用 ResNet 塊和 CBAM 注意力機制進行特徵提取,以增強機器人在目標導航階段的導航能力。
在 iGibson 環境中進行的圖像目標導航任務實驗結果表明,與現有的認知記憶結構相比,NUE 能夠顯著提高導航性能,尤其是在高度依賴探索的複雜場景中。
NUE 框架通過利用 NeRF 場景表徵的不確定性,有效地增強了機器人在未知環境中的探索能力,並實現了從探索到目標導航的自然過渡,從而提高了導航效率。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies