Core Concepts
사용자의 의도를 이해하고 대화를 통해 목표 물체를 찾아 잡는 로봇 시스템 제안
Abstract
이 논문은 사용자의 의도를 이해하고 대화를 통해 목표 물체를 찾아 잡는 새로운 로봇 시스템 PROGrasp을 제안한다. 기존의 물체 잡기 시스템은 사용자가 목표 물체의 카테고리를 명시적으로 제공하는 것을 전제로 하지만, PROGrasp은 사용자의 의도 지향적 발화(예: "나는 목마르다")를 이해하고 대화를 통해 목표 물체를 찾는다.
PROGrasp은 다음과 같은 모듈로 구성된다:
시각적 접지 모듈(VG): 대화 내용을 바탕으로 유효한 물체 영역을 예측한다.
질문 생성 모듈(Q-gen): 사용자의 의도를 파악하기 위한 질문을 생성한다.
답변 해석 모듈(A-int): 사용자의 응답을 해석하여 목표 물체를 추론한다.
물체 잡기 모듈(OG): 추론된 목표 물체의 3D 좌표를 계산하고 물체를 잡는다.
PROGrasp은 이 모듈들을 통해 사용자의 의도를 이해하고 대화를 통해 목표 물체를 효과적으로 찾아낸다. 오프라인 실험에서 PROGrasp은 기존 방법보다 35% 향상된 성능을 보였으며, 온라인 실험에서도 17% 높은 성공률을 달성했다. 또한 PROGrasp은 대화를 통해 목표 물체를 효율적으로 찾아내는 것으로 나타났다.
Stats
"나는 목마르다."
"내 기기의 배터리가 소진되었다."
Quotes
"사용자의 의도를 이해하고 대화를 통해 목표 물체를 찾아 잡는 것이 다음 세대 로봇 시스템의 핵심 기능이 될 것이다."
"PROGrasp은 사용자의 의도 지향적 발화를 이해하고 대화를 통해 목표 물체를 효과적으로 찾아내는 것으로 나타났다."