Dennler, N., Shi, Z., Nikolaidis, S., & Matarić, M. (2024). Improving User Experience in Preference-Based Optimization of Reward Functions for Assistive Robots. arXiv preprint arXiv:2411.11182v1.
本研究旨在探討如何提升使用者在輔助機器人獎勵函數偏好優化過程中的體驗,並開發一種更有效率且使用者友善的偏好學習演算法。
研究者提出了一種結合資訊增益和協方差矩陣適應進化策略的新演算法 CMA-ES-IG,並通過模擬和使用者研究對其進行評估。模擬實驗比較了 CMA-ES-IG 與其他演算法在學習使用者偏好和生成高品質軌跡方面的表現。使用者研究則招募了參與者,讓他們分別使用不同演算法來訓練機器人完成特定任務,並評估他們對不同演算法的易用性和感知行為適應性。
CMA-ES-IG 演算法能夠有效提升使用者在輔助機器人獎勵函數偏好優化過程中的體驗,並提高偏好學習的效率。
本研究強調了使用者體驗在演算法設計中的重要性,並為開發更人性化、更有效的機器人學習系統提供了新的思路。
本研究主要關注機器人軌跡的偏好學習,未來可以進一步探討 CMA-ES-IG 在其他機器人任務和互動模式中的應用。此外,未來研究可以探討如何將使用者偏好的個體差異納入演算法設計中,以實現更精準的個人化學習。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Tiefere Fragen