מושגי ליבה
로봇이 자연어로 표현된 작업 목록을 기반으로 환경의 과제 관련 객체와 영역을 선별적으로 포함하는 압축된 3D 장면 그래프를 실시간으로 구축한다.
תקציר
이 논문은 로봇 인지와 매핑을 위한 새로운 접근법인 과제 주도 3D 장면 이해 문제를 제안한다. 로봇은 자연어로 표현된 작업 목록을 받고, 이를 완수하는 데 필요한 객체와 영역만을 포함하는 압축된 3D 장면 그래프를 구축한다.
이를 위해 저자들은 정보 병목 이론을 활용하여 과제 관련성에 따라 3D 원시 요소를 클러스터링하는 증분 Agglomerative IB 알고리즘을 개발했다. 이 알고리즘은 실시간으로 작동하며 온보드 컴퓨팅만을 사용한다.
저자들은 Clio라는 실시간 시스템을 구축하여 제안된 알고리즘을 통합했다. Clio는 로봇이 환경을 탐색하는 동안 과제 관련 객체와 영역으로 구성된 계층적 3D 장면 그래프를 생성한다. 실험 결과, Clio는 압축된 개방형 3D 장면 그래프를 실시간으로 구축할 뿐만 아니라 과제 수행 정확도도 향상시킨다.
סטטיסטיקה
로봇이 주어진 작업 목록을 완수하는 데 필요한 객체와 영역만을 포함하는 압축된 3D 장면 그래프를 실시간으로 구축할 수 있다.
Clio는 기존 접근법에 비해 약 6배 빠르게 작동한다.
Clio는 작업 관련 객체와 영역을 효과적으로 식별하여 작업 수행 정확도를 향상시킨다.
ציטוטים
"로봇이 자연어로 표현된 작업 목록을 기반으로 환경의 과제 관련 객체와 영역을 선별적으로 포함하는 압축된 3D 장면 그래프를 실시간으로 구축한다."
"Clio는 압축된 개방형 3D 장면 그래프를 실시간으로 구축할 뿐만 아니라 과제 수행 정확도도 향상시킨다."