Core Concepts
사용자의 의도를 이해하고 그에 맞는 물체를 찾아 잡는 로봇 시스템 PROGrasp
Abstract
PROGrasp는 사용자의 의도 기반 발화를 이해하고 그에 맞는 물체를 찾아 잡는 새로운 로봇 시스템입니다. 기존의 물체 잡기 시스템은 사용자가 물체의 카테고리를 명시적으로 제공하는 것을 전제로 했지만, PROGrasp는 사용자의 의도 기반 발화(예: "나 목이 말라.")를 이해하고 그에 맞는 물체를 찾아 잡습니다.
PROGrasp는 다음과 같은 모듈로 구성됩니다:
시각적 그라운딩 모듈(VG): 사용자 발화와 이미지 정보를 활용하여 유효한 물체 영역을 예측합니다.
질문 생성 모듈(Q-gen): 사용자와의 대화를 통해 목표 물체를 식별하기 위한 질문을 생성합니다.
답변 해석 모듈(A-int): 사용자의 응답을 해석하여 목표 물체를 식별합니다.
물체 잡기 모듈(OG): 식별된 목표 물체의 3D 좌표를 계산하고 물체를 잡습니다.
PROGrasp는 이 모듈들을 통해 사용자의 의도를 이해하고 목표 물체를 효과적으로 찾아 잡습니다. 오프라인 실험에서 PROGrasp는 기존 방법보다 35% 향상된 성능을 보였으며, 온라인 실험에서도 17% 더 높은 성공률을 달성했습니다. 또한 PROGrasp는 더 적은 대화 횟수로 목표 물체를 효율적으로 식별할 수 있습니다.
Stats
"나는 목이 말라."
"내 기기 배터리가 다 되었어."
Quotes
"사용자의 의도를 이해하고 그에 맞는 물체를 찾아 잡는 것이 다음 세대 로봇 시스템의 핵심 기능이 될 것이다."
"PROGrasp는 사용자의 의도 기반 발화를 이해하고 목표 물체를 효과적으로 찾아 잡는다."