Splat-MOVER는 세 가지 주요 모듈로 구성됩니다:
ASK-Splat: 3D 장면에 의미론적 및 그래스 어포던스 특징을 포함하는 가우시안 스플래팅 기반 표현. 이를 통해 기하학적, 의미론적, 그리고 어포던스 이해가 가능합니다.
SEE-Splat: 실시간 3D 의미론적 마스킹과 채우기를 사용하여 로봇 상호작용으로 인한 객체 움직임을 시각화하는 실시간 장면 편집 모듈. 이를 통해 진화하는 환경에 대한 "디지털 트윈"을 생성합니다.
Grasp-Splat: ASK-Splat와 SEE-Splat를 활용하여 오픈 월드 객체에 대한 어포던스 정렬 그래스 후보를 제안하는 그래스 생성 모듈.
이 세 모듈이 결합되어 자연어 설명을 입력받아 실행 가능한 동작 계획을 생성하는 Splat-MOVER를 구성합니다. 하드웨어 실험에서 Splat-MOVER는 최근 두 가지 기준 방법보다 우수한 성능을 보였으며, 특히 다단계 조작 작업에서 기존 방법이 불가능한 장면 편집 기능을 활용하여 뛰어난 결과를 달성했습니다.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Ola Shorinwa... às arxiv.org 09-30-2024
https://arxiv.org/pdf/2405.04378.pdfPerguntas Mais Profundas