核心概念
在主動推論代理中,利用對非線性觀測函數的高斯近似可以引入一個依賴於狀態的模糊性項,從而導致代理對某些狀態的偏好。這種偏好可以用於規劃代理的軌跡,使其避免難以準確估計的狀態。
摘要
本文探討了在主動推論代理中使用非線性觀測函數的高斯近似方法。
- 代理的狀態轉移和觀測模型被描述為線性高斯模型,但觀測函數是非線性的。
- 作者分析了三種不同的高斯近似方法:一階泰勒展開、二階泰勒展開和無香味變換。
- 結果表明,一階泰勒展開和無香味變換導致了與狀態無關的模糊性項,而二階泰勒展開則引入了依賴於狀態的模糊性項。
- 依賴於狀態的模糊性項會導致代理偏好某些狀態,因為這些狀態可以更準確地從觀測中估計。
- 作者設計了一個機器人導航實驗,驗證了這種偏好對代理規劃軌跡的影響。結果顯示,使用二階泰勒展開的代理能夠更好地規避難以估計的狀態,從而產生更平滑的軌跡。
統計資料
機器人的狀態包括平面位置和時間導數,共4維。
觀測包括相對角度和距離,由非線性函數g(x)產生。
狀態轉移和觀測噪聲均為高斯分佈。