이 논문은 로봇이 사람에게 영향력을 발휘하면서도 안전성을 유지할 수 있는 방법을 제안한다.
먼저 사람의 행동을 예측하는 조건부 행동 예측 모델을 사용하여 로봇이 사람에게 미치는 영향력을 모델링한다.
그리고 이를 바탕으로 물리적 상태와 로봇의 신념 상태를 모두 고려하는 도달-회피 동적 게임을 풀어 안전하면서도 효율적인 로봇 정책을 학습한다.
실험 결과, 제안 방법인 SLIDE는 기존 안전 제어 방법보다 과제 완수율이 높으면서도 충돌률이 낮은 것으로 나타났다.
또한 사람의 행동이 예측 모델의 분포를 벗어나는 경우에도 어느 정도 강건한 성능을 보였다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Ravi Pandya,... في arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.12153.pdfاستفسارات أعمق