核心概念
로봇이 사용자의 목표와 일치하지 않는 계획을 자신감 있게 실행하거나, 사용자의 도움을 더 자주 요청하거나, 도움을 요청하지 않는 문제를 해결하기 위해 장면 어포던스를 활용하여 LLM의 신뢰도를 향상시킬 수 있다.
摘要
이 논문은 대형 언어 모델(LLM)과 물체 및 장면 어포던스를 활용하여 로봇 계획자의 유해한 환각을 최소화하고 도움이 필요한 시기를 알 수 있는 LAP라는 새로운 접근법을 소개한다.
주요 내용은 다음과 같다:
- 장면 어포던스 점수를 계산하고 활용하면 LLM의 예측에서 환각을 완화하고 LLM의 신뢰도 측정을 성공 확률과 더 잘 정렬할 수 있다.
- 세 가지 다른 어포던스 점수를 제안하고 평가했으며, 이를 독립적으로 또는 함께 사용하여 다양한 사용 사례에서 성능을 향상시킬 수 있다.
- LLM에 대한 프롬프트 기반 방법을 통해 안전성 등 중요한 행동을 포함하는 더 유연한 어포던스 점수를 생성할 수 있다.
- 최신 강력한 언어 모델을 사용하는 것이 이전 모델을 미세 조정하는 것보다 우수한 성능을 보인다.
실험 결과, LAP는 시뮬레이션과 실제 세계 환경에서 모두 이전 방법보다 성공률을 높이고 사용자 개입을 줄일 수 있음을 보여준다.
統計資料
실제 세계 실험에서 LAP는 KnowNo 대비 70% 성공률에서 인간 도움률을 33% 감소시켰다.
시뮬레이션 실험에서 LAP는 60% 성공률에서 KnowNo 대비 인간 도움률을 70% 이상 감소시켰다.
引述
"LLM은 실제 세계와 연결되어 있지 않아 자주 환각을 일으킨다. 또한 모호한 지시가 주어지면 사용자에게 도움을 요청할 시기를 알아야 한다."
"우리의 핵심 발견은 장면 어포던스 점수를 계산하고 활용하면 LLM 예측의 환각을 완화하고 LLM의 신뢰도 측정을 성공 확률과 더 잘 정렬할 수 있다는 것이다."