Splat-MOVER는 세 가지 주요 모듈로 구성됩니다:
ASK-Splat: 3D 장면에 의미론적 및 그래스 어포던스 특징을 포함하는 가우시안 스플래팅 기반 표현. 이를 통해 기하학적, 의미론적, 그리고 어포던스 이해가 가능합니다.
SEE-Splat: 실시간 3D 의미론적 마스킹과 채우기를 사용하여 로봇 상호작용으로 인한 객체 움직임을 시각화하는 실시간 장면 편집 모듈. 이를 통해 진화하는 환경에 대한 "디지털 트윈"을 생성합니다.
Grasp-Splat: ASK-Splat와 SEE-Splat를 활용하여 오픈 월드 객체에 대한 어포던스 정렬 그래스 후보를 제안하는 그래스 생성 모듈.
이 세 모듈이 결합되어 자연어 설명을 입력받아 실행 가능한 동작 계획을 생성하는 Splat-MOVER를 구성합니다. 하드웨어 실험에서 Splat-MOVER는 최근 두 가지 기준 방법보다 우수한 성능을 보였으며, 특히 다단계 조작 작업에서 기존 방법이 불가능한 장면 편집 기능을 활용하여 뛰어난 결과를 달성했습니다.
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Ola Shorinwa... ที่ arxiv.org 09-30-2024
https://arxiv.org/pdf/2405.04378.pdfสอบถามเพิ่มเติม