Centrala begrepp
Splat-MOVER는 3D 장면 표현, 실시간 장면 편집, 그리고 어포던스 정렬 그래스 생성을 통해 다단계 오픈 어휘 로봇 조작을 가능하게 하는 모듈식 로봇 스택입니다.
Sammanfattning
Splat-MOVER는 세 가지 주요 모듈로 구성됩니다:
-
ASK-Splat: 3D 장면에 의미론적 및 그래스 어포던스 특징을 포함하는 가우시안 스플래팅 기반 표현. 이를 통해 기하학적, 의미론적, 그리고 어포던스 이해가 가능합니다.
-
SEE-Splat: 실시간 3D 의미론적 마스킹과 채우기를 사용하여 로봇 상호작용으로 인한 객체 움직임을 시각화하는 실시간 장면 편집 모듈. 이를 통해 진화하는 환경에 대한 "디지털 트윈"을 생성합니다.
-
Grasp-Splat: ASK-Splat와 SEE-Splat를 활용하여 오픈 월드 객체에 대한 어포던스 정렬 그래스 후보를 제안하는 그래스 생성 모듈.
이 세 모듈이 결합되어 자연어 설명을 입력받아 실행 가능한 동작 계획을 생성하는 Splat-MOVER를 구성합니다. 하드웨어 실험에서 Splat-MOVER는 최근 두 가지 기준 방법보다 우수한 성능을 보였으며, 특히 다단계 조작 작업에서 기존 방법이 불가능한 장면 편집 기능을 활용하여 뛰어난 결과를 달성했습니다.
Statistik
수프 냄비를 전기 버너로 옮기는 작업에서 Splat-MOVER의 성공률은 100%이며, 이는 LERF-TOGO의 40%보다 2.5배 높습니다.
칼을 도마 위에 놓는 작업에서 Splat-MOVER의 성공률은 85%이며, 이는 LERF-TOGO의 35%보다 2.4배 높습니다.
세척제를 쓰레기통에 넣는 작업에서 Splat-MOVER의 성공률은 90%이며, 이는 LERF-TOGO의 25%보다 3.6배 높습니다.
전동 드릴을 작업대 위에 놓는 작업에서 Splat-MOVER의 성공률은 95%이며, 이는 LERF-TOGO의 100%와 유사합니다.
Citat
"Splat-MOVER는 3D 장면 표현, 실시간 장면 편집, 그리고 어포던스 정렬 그래스 생성을 통해 다단계 오픈 어휘 로봇 조작을 가능하게 하는 모듈식 로봇 스택입니다."
"ASK-Splat는 3D 장면에 의미론적 및 그래스 어포던스 특징을 포함하는 가우시안 스플래팅 기반 표현을 제공합니다."
"SEE-Splat는 실시간 3D 의미론적 마스킹과 채우기를 사용하여 로봇 상호작용으로 인한 객체 움직임을 시각화하는 실시간 장면 편집 모듈입니다."
"Grasp-Splat는 ASK-Splat와 SEE-Splat를 활용하여 오픈 월드 객체에 대한 어포던스 정렬 그래스 후보를 제안하는 그래스 생성 모듈입니다."