이 연구는 대규모 언어 모델(LLM)이 인간-로봇 상호작용(HRI)에서 제로샷 인간 모델로 활용될 수 있는지 탐구한다. 인간 모델은 로봇이 인간의 행동을 고려하여 행동을 계획할 수 있게 해주지만, 이를 구축하는 것은 어려운 과제이다. 이 연구에서는 LLM이 방대한 양의 인간 생성 텍스트 데이터를 학습했기 때문에, 인간 행동을 모방할 수 있을 것이라 가정한다.
실험 결과, LLM은 특화된 모델과 유사한 성능을 보였다. 이는 추가적인 학습 없이도 LLM이 인간 행동을 잘 모사할 수 있음을 보여준다. 그러나 LLM은 공간적/수치적 추론이 필요한 작업에서는 성능이 떨어지는 것으로 나타났다. 또한 프롬프트 구조에 민감한 것으로 확인되었다.
이러한 한계에도 불구하고, 연구진은 LLM 기반 인간 모델을 HRI 시나리오의 계획에 통합하는 사례 연구를 수행했다. 시뮬레이션 실험에서는 LLM 기반 모델이 기존 모델과 유사한 성과를 보였다. 또한 새로운 식기 전달 실험에서는 LLM 기반 모델이 과도한 신뢰를 완화하는 합리적인 계획을 생성했다. 다만 참가자들의 반응에서 물체 형상에 대한 인식이 신뢰에 영향을 미치는 것으로 나타나, 이를 LLM에 통합하는 것이 향후 과제로 제시되었다.
종합하면, LLM은 HRI에서 유용한 제로샷 인간 모델이 될 수 있지만, 공간적/물리적 추론 능력의 한계로 인해 단독으로는 완벽한 모델이 되기 어렵다. 따라서 LLM과 다른 모델을 결합하는 등의 접근이 필요할 것으로 보인다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Bowen Zhang,... klokken arxiv.org 10-03-2024
https://arxiv.org/pdf/2303.03548.pdfDypere Spørsmål