核心概念
本文提出了一種名為 ANAVI 的框架,使機器人能夠預測其動作在室內環境中產生的噪音等級,並據此規劃更安靜的移動路徑,以減少對人類和其他聽者的干擾。
摘要
ANAVI:基於室內環境視覺的聽覺噪音感知導航系統
研究目標:
本研究旨在開發一種讓機器人能夠感知其動作所產生噪音的系統,並根據環境噪音限制調整其行為,以實現更安靜的室內導航。
方法:
- 利用 Matterport3D 資料集中的真實室內環境掃描數據,在 SoundSpaces 模擬器中生成機器人在不同位置和方向上產生聲音的脈衝響應數據集。
- 訓練一個名為「聲學噪音預測器」(ANP) 的模型,該模型使用機器人位置的全景 RGB 圖像、聽者相對於機器人的距離和方向,預測聽者位置的聲壓級 (dB SPL)。
- 將 ANP 模型整合到機器人導航框架中,使其能夠估計不同路徑的噪音成本,並規劃出噪音更低的路徑。
主要發現:
- 相比僅基於距離的啟發式方法和學習基線模型,結合視覺特徵的 ANP 模型在預測聲學噪音方面表現更出色。
- ANP 模型能夠準確預測不同室內環境(如開放空間、走廊和房間)中的聲學噪音變化。
- 在真實世界的實驗中,ANAVI 框架成功地引導機器人選擇噪音更低的移動路徑,證明了其在實際應用中的潛力。
主要結論:
- 結合視覺感知的聲學噪音預測模型可以有效地預測機器人在室內環境中產生的噪音等級。
- ANAVI 框架提供了一種實用的解決方案,使機器人能夠在執行任務時,將噪音對環境的影響降至最低。
意義:
本研究對於開發更適應人類環境的機器人具有重要意義,尤其是在需要安靜環境的家庭、醫院和辦公室等場景中。
局限性和未來研究方向:
- 目前的 ANP 模型尚未考慮環境噪音的影響,例如電視或其他聲源的噪音。
- 未來研究可以探索更精確的噪音感知指標,例如考慮聲音頻率、持續時間和心理聲學因素。
- 未來工作可以進一步優化 ANAVI 框架,使其能夠在更複雜的室內環境中運行,並處理動態變化的噪音條件。
統計資料
機器人吸塵器的噪音可能高達 70 分貝。
在模擬實驗中,每個地圖採樣 5,000 個數據點,驗證和測試集則為每個地圖 500 個數據點。
ϵ-精確度計算中,ϵ 值設定為 1/128,約等於 0.007,用於評估模型在 1 分貝以內的預測準確度。
人類的最小可覺差 (JND) 在 1000-5000 Hz 頻率範圍內約為 1 分貝。
真實世界實驗中,使用筆記本電腦播放機器人動作的錄音,並使用手機拍攝全景圖像、測量距離和錄製聲音。
在臥室環境中,距離聲源 0.5 米處測得的 Stretch 機器人快速前進的聲音為 52 分貝,而 Unitree Go2 機器人奔跑的聲音為 70 分貝。
引述
"While humans are naturally aware of the noise they make and its impact on those around them, robots currently lack this awareness."
"A key challenge in achieving audio awareness for robots is estimating how loud will the robot’s actions be at a listener’s location?"
"Although sound is inevitable with robot movement, it can be mitigated."